组件总览

Appbuilder-SDK 提供了一系列组件,用于快速构建AI原生应用, 包括 大模型组件、AI能力组件、基础云组件、软硬一体组件等。

组件详细说明

大模型组件

| 组件名称 | 类型 | 描述 | 链接 | |——————|————–|————————————————————————————————————|———————————————————————————————————–| | Query改写 | RAG | Query改写组件(QueryRewrite)用于处理多轮对话和查询改写,理解和优化用户与机器人的交互,进行指代消解及省略补全。 | 链接 | | 相似问生成 | 文本生成 | 相似问生成组件(SimilarQuestion)可以基于输入的问题,挖掘出与该问题相关的类似问题,广泛用于客服、问答等场景。 | | | 自然语言转pandas | 文本生成 | 自然语言转pandas组件(Nl2pandas)通过理解对表格信息的提问,生成对应语义的可执行Python代码,主要使用Pandas库。 | | | 标签抽取 | 文本生成 | 标签抽取组件(TagExtraction)是一款高效的标签抽取组件,基于生成式大模型,用于从文本中提取关键标签。 | | | 会话小结 | 文本生成 | 会话小结组件(DialogSummary)基于生成式大模型对用户与坐席的对话生成总结,结果按{“诉求”: “”, “回应”: “”, “解决情况”: “”}格式输出。 | | | 口语化Query生成 | 文本生成 | 口语化Query生成组件(OralQueryGeneration)可以基于输入文本生成与文档内容相关的Query,适用于增强文档索引等场景。 | | | 复杂Query分解 | RAG | 复杂Query分解组件(QueryDecomposition)可以将复杂问题拆解为简单问题,广泛应用于知识问答场景。 | | | 复杂Query判定 | RAG | 复杂Query判定组件(IsComplexQuery)可以根据输入的提问进行分类,区分简单问题和复杂问题,适用于知识问答场景。 | | | 风格转写 | 文本生成 | 风格转写组件(StyleRewrite)可以基于生成式大模型对文本的风格进行改写,支持多种文本风格。 | | | 风格写作 | 文本生成 | 风格写作组件(StyleWriting)是一款基于生成式大模型进行文本创作的工具,支持多种风格,适用于编写文案、广告等多种场景。 | 链接 | | 问答对挖掘 | 文本生成 | 问答对挖掘(QAPairMining)可以基于输入文本内容,快速生成多个问题及对应答案,广泛用于在线客服、智能问答等领域。 | 链接 | | 阅读理解问答 | RAG | 阅读理解问答(MRC)组件是基于生成式大模型的阅读理解问答系统。支持拒答、澄清、重点强调、友好性提升、溯源等多种功能。 | | | playground空应用 | 文本生成 | playground空应用(Playground)是一款灵活的组件,允许用户自定义prompt模板并执行。它适用于各种场景,特别是在需要自定义输入模板和使用预训练模型进行交互的情况下。 | |

AI能力组件

以下是上述文档内容,按照您的要求,格式化为 Markdown 表格,分为五列:组件名称、类型、描述、额度详情、链接:

| 组件名称 | 类型 | 描述 | 额度详情 | 链接 | |———————-|——————–|—————————————————————————————————————————|————————————————————-|———————————————————–| | 文本翻译-通用版 | Translation | 提供200+语种互译的在线文本翻译服务,支持术语定制功能,适用于移动端、PC网站、智能硬件等。 | 个人认证:总量500万字符,10qps
企业认证:总量1000万字符,100qps | 详情 | | AI作画-高级版 | Text2Image | 根据用户输入的文本,自动创作不限定风格的图,为内容创作者提供灵感和高质量配图。 | 个人认证:总量20点,1并发
企业认证:总量40点,1并发 | 详情 | | 通用物体和场景识别-高级版 | ObjectRecognition | 识别超过10万类常见物体和场景,返回大类及细分类名称,适用于图像或视频内容分析、拍照识图等。 | 个人认证:总量10000次,2qps
企业认证:总量30000次,2qps | 详情 | | 通用文字识别-高精度版 | GeneralOCR | 支持多场景、多语种、高精度的文字识别服务,对图片/文件全部文字内容进行检测识别。 | 个人认证:1000次/月,2qps
企业认证:2000次/月,2qps | 详情 | | 菜品识别 | DishRecognition | 识别超过9千种菜品,可准确识别图片中的菜品名称、卡路里,适用于多种客户识别菜品的业务场景。 | 个人认证:总量1000次,2qps
企业认证:总量3000次,2qps | 详情 | | 地标识别 | LandmarkRecognition | 识别12万中外著名地标、热门景点,返回地标名称。 | 个人认证:总量1000次,2qps
企业认证:总量3000次,2qps | 详情 | | 短语音识别-极速版 | ASR | 将音频流实时识别为文字,并返回每句话的开始和结束时间。适用于手机语音输入、语音搜索、人机对话等。 | 个人认证/企业认证:5并发,5w次 | 详情 | | 短文本在线合成-基础音库 | TTS | 提供高度拟人、流畅自然的语音合成服务,将文本朗读出来,基础音库性价比更高。 | 个人认证:总量50000次,10并发
企业认证:总量100000000次,100并发 | 详情 | | 短文本在线合成-精品音库 | TTS | 提供高度拟人、流畅自然的语音合成服务,将文本朗读出来,精品音库听感更逼真。 | 个人认证:总量2000次,3并发
企业认证:总量5000次,5并发 | 详情 | | 文本转语音 | TTS | 将输入的文本转化为音频文件,主要用于语音合成,适用于智能语音交互,自动语音播报等场景。 | 每个账号限额最高5并发 | - | | 文档解析 | DocParser | 用于文档内容解析,支持PDF、JPG、DOC、TXT、XLS、PPT等17种文档格式,可解析出文档版式、位置坐标、表格结构等。 | 暂时免费,每个账号限额最高5 QPS | - | | 文档切分 | DocSplitter | 用于对文档进行段落切分,支持将文档划分为多个段落,便于后续处理和分析。 | 暂时免费,每个账号限额最高5 QPS | - | | 语义匹配 | Matching | 用于计算query与文本列表之间的相似度关系,并根据其进行排序。适用于文本检索、信息推荐、知识挖掘等场景。 | - | 购买 | | 语义向量计算 | Embedding | 支持将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。 | - | 购买 | | 表格抽取 | ExtractTableFromDoc | 用于文档表格处理,从文档中抽取表格。支持对文档表格大小进行限制,限制后自动进行拆分、跨页合并等处理;支持合并表格上文,提取的表格为Markdown格式。 | 暂时免费,每个账号限额最高5 QPS | - |

基础云组件

以下是上述文档内容,格式化为 Markdown 表格:

| 组件名称 | 类型 | 描述 | 链接 | 文档 | |———–|—————|——————————————————————————————————|———————————————————–|————————————————————| | 百度Elasticsearch | BES | 提供高性能、灵活扩展的向量与标量混合存储检索服务,支持多种索引类型和相似度计算方法,仅支持V7.x版本。 | 购买 | 使用文档 | | 向量检索 | BESRetriever | 基于Baidu ElasticSearch的内容检索组件,支持根据文本的向量的相似度进行内容检索。 | - | - |

软硬一体组件等

以下是您提供的文档内容,格式化为 Markdown 表格:

| 组件名称 | 类型 | 描述 | 链接 | |————–|———|————————————————————|————————————————————-| | 多模态AI模组LUCA系列 | - | 一款具备视觉、语音、文本、音频、视频采集识别和理解能力的多模态AI模组 | 详情 |