Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
82 changes: 82 additions & 0 deletions docs/MatrixOne-Intelligence/Data-Processing/workflow.md
Original file line number Diff line number Diff line change
Expand Up @@ -121,6 +121,88 @@

![](https://community-shared-data-1308875761.cos.ap-beijing.myqcloud.com/artwork/mocdocs/images/wf_extract.png)

##### 数据类型选取

信息提取节点支持以下数据类型:object、string、boolean、number、array/string、array/boolean、array/number、array/object。
选择合适的数据类型有助于提升提取准确率与后续流程处理效率。

**基础类型**

- **string(字符串)**:适用于文本型字段,内容通常不需要数值运算。例如单个名称、标题、编号、描述类字段,地址、备注、说明信息,单个日期等。示例:
- 客户公司:“xxx 有限公司”
- 发票代码:“1234567890”
- 出生日期:“1990-05-13”

- **number(数字)**:适用于可用于计算或比较的数值类型字段。例如金额、数量、百分比、税率,年限、次数、工龄等整数信息。示例:
- 金额:12345.67
- 税率:0.13
- 库存数量:150

- **boolean(布尔)**:用于二值判断,只有“是/否”“true/false”这类答案。例如是否通过审核、是否含税、是否在职等。示例:
- is_active: true
- is_tax_included: false

- **object(对象结构)**:用于结构化数据,一个字段内部包含多个子字段。适用于复杂实体或字段组。例如地址对象(省、市、区、详细地址),发票信息对象(发票号 + 开票日期 + 金额),简历中“教育经历”“工作经历”中的单个经历条目等。示例:

``` json
{
"company": "矩阵起源",
"position": "工程师",
"start_date": "2020-01",
"end_date": "2023-01"
}
```

**数组类型**

- **array/string(字符串数组)**:用于一个字段中可能有多个文本值的情况。例如技能列表(如简历),多个标签,多个收件人、多个科目名等。示例:

```json
[“Java”, “Python”, “SQL”]
```

- **array/number(数字数组)**:用于多个数值型项的情况。例如多期间的金额列表,多个评分,数字型属性集合等。示例:

```json
[95, 88, 76]
```

- **array/boolean(布尔数组)**:适用于多个布尔字段组合。例如多维权限标识、每日是否出勤(true/false 列表)等。示例:

```json
[true, false, true]
```

- **array/object(对象数组)**:最常用的复合结构之一,用于包含多个类似对象的列表。当文本中存在重复结构时选它。例如简历中的多段工作经历、教育经历,发票中的多条明细项(品名、数量、单价、金额),财务报表中的多行科目,报表中多条交易记录等。示例:

```json
[
{
"item": "商品 A",
"quantity": 2,
"price": 100
},
{
"item": "商品 B",
"quantity": 1,
"price": 200
}
]
```

总结:

| 类型 | 使用场景 |
|---------------|---------------------------|
| string | 单个文本字段(名称、编号、日期、描述等) |
| number | 金额、数量、比率、数值计算字段 |
| boolean | 是否类字段(是/否、true/false) |
| object | 一个字段包含多个子字段,结构化实体 |
| array/string | 多个文本项(技能、标签、科目名列表) |
| array/number | 数字集合(多期金额、评分列表) |
| array/boolean | 多布尔项(如每日出勤表) |
| array/object | 多条结构化记录(工作经历、发票明细、报表行) |

#### 数据清洗节点

自动识别并处理冗余、错误或不规范数据,提升数据准确性与一致性。
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -26,7 +26,7 @@ MatrixOne Intelligence 支持在阿里云创建实例。

=== "生产实例"

如果您想创建生产实例,可以通过线下充值或者使用我们发放的代金券方式为您的平台账户充值,只要账户里有钱就可以创建和使用 serverless 生产实例。
如果您想创建生产实例,可以通过线上充值或者使用我们发放的代金券方式为您的平台账户充值,只要账户里有钱就可以创建和使用 serverless 生产实例。

选择**生产使用**,MO Intelligence 会为该实例配置独立的、可根据业务需求自动伸缩的计算资源,从而实现近乎极致的性能。此外,您可以配置以下选项:

Expand Down