API介绍
自动爬取网页输出markdown和结构化数据
API调试台
登录后,探索更多精彩功能! 点击登录
API列表 (3)
| API描述 | 接口地址 | 请求方法 | 稳定性 | 参数说明 |
|---|---|---|---|---|
生成Schema | POST | 稳定 | 查看详情 | |
文档详情 通过网页跟描述生成对应Schema 价格:根据调用的模型收费 请求参数 Header参数Authorizationstring必需 示例值: Bearer {{YOUR_API_KEY}}Modelstring可选 示例值: gpt-4o-miniBody参数 application/jsondescriptionstring必需 比如:获取AI大模型的具体介绍跟使用场景 urlstring必需 需要爬取的数据的目标链接,生成更合适的数据结构 | ||||
创建提取任务 | POST | 稳定 | 查看详情 | |
文档详情 创建网页爬取任务 价格:根据调用的模型收费 请求参数 Header参数Authorizationstring必需 示例值: Bearer {{YOUR_API_KEY}}Modelstring可选 示例值: gpt-4o-miniBody参数 application/jsonurlsarray[string]必需 需要爬取的网页链接 targetstring必需 详细的任务描述有利于爬取数据的准确性 schemaobject可选 需要返回的数据格式结构 recursiveConfigobject必需 基本的爬虫设置 matchTypestring必需 自动为直接获取信息,手动则是先获取对应爬虫代码 searchModelstring必需 默认只爬取传入链接,深度为自动检索相关链接 outputMdboolean必需 是否输出网页提取的markdown内容 maxDepthinteger必需 开启深度模式的深度限制 maxUrlsinteger必需 最大检索链接限制 proxyConfigobject可选 打开网页时候使用的代理服务 proxyUrlstring可选 proxyUsernamestring可选 proxyPasswordstring可选 browserConfigobject可选 浏览器详细设置 headlessboolean可选 browserTypestring可选 viewportWidthinteger可选 viewportHeightinteger可选 userAgentstring可选 cacheEnabledboolean可选 jsEnabledboolean可选 lightModeboolean可选 textModeboolean可选 cookiesarray[string]可选 headersobject可选 Accept-Languagestring必需 | ||||
查询提取进度 | GET | 稳定 | 查看详情 | |
文档详情 获取网页爬取任务进度 价格:免费 请求参数 Path参数taskIdstring必需 示例值: 44dd2497-0057-4610-ba96-c64608819a46Header参数Authorizationstring必需 示例值: Bearer {{YOUR_API_KEY}}Body参数 application/jsonobject | ||||
API价格表
$¥ 円 ₽
| 模型 | 说明 | 302.AI价格 |
|---|
Generate Schema | 生成Schema |
|
Create an extraction task | 创建提取任务 |
|
Query extraction progress | 查询提取进度 |
|
