文字识别 OCR
百度文字识别OCR提供多场景、多语种、高精度的文字检测与识别服务,多项ICDAR指标居茅。广泛适用于远程身份认证、文档电子化、金融保险、法律政务、财税报销、快递物流、交通出行、教育培训等场景,让应用看图识字,提升输入效率,优化用户体验,为企业降本增效。
接口能力
接口名称 | 接口能力简要描述 |
---|---|
通用场景文字识别 | 对各类通用场景、文件的识别接口,按行返回识别结果 |
通用文字识别(标准版) | 识别图片中的文字信息 |
通用文字识别(高精度版) | 更高精度地识别图片中的文字信息 |
通用文字识别(标准含位置版) | 识别图片中的文字信息(包含文字区域的坐标信息) |
通用文字识别(高精度含位置版) | 更高精度地识别图片中的文字信息(包含文字区域的坐标信息) |
文档版面分析与识别 | 可对文档版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果 |
网络图片文字识别 | 针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果 |
数字识别 | 识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景 |
表格文字识别 | 对单据或报表中的表格内容进行结构化识别,并以JSON或Excel形式返回 |
二维码识别 | 对二维码、条形码中对应的文字内容进行识别 |
卡证文字识别 | 对各类卡片、证照进行结构化识别,按字段返回识别结果 |
身份证识别 | 对二代居民身份证正反面所有8个字段进行结构化识别 |
银行卡识别 | 对银行卡的卡号、有效期、发卡行、卡片类型进行结构化识别 |
营业执照识别 | 对营业执照进行识别 |
护照识别 | 支持对中国大陆居民护照的资料页进行结构化识别,包含国家码、姓名、性别、护照号、出生日期、签发日期、有效期至、签发地点 |
港澳通行证识别 | 对港澳通行证证号、姓名、姓名拼音、性别、有效期限、签发地点、出生日期字段进行识别 |
台湾通行证识别 | 对台湾通行证证号、签发地、出生日期、姓名、姓名拼音、性别、有效期字段进行识别 |
户口本识别 | 对出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码字段进行识别 |
名片识别 | 提供对各类名片的结构化识别功能,提取姓名、邮编、邮箱、电话、网址、地址、手机号字段 |
出生医学证明识别 | 对出生时间、姓名、性别、出生证编号、父亲姓名、母亲姓名字段进行识别 |
多卡证类别检测 | 【请点击申请邀测提交需求申请开通该接口使用权限】对同一张图片中的多种卡证进行类别检测和定位,支持身份证正反面、行驶证正副页、驾驶证正副页、银行卡、营业执照5类常见卡证、8种版式 |
财务票据文字识别 | 对财务及金融场景各类票据进行结构化识别,按字段返回识别结果(通用票据识别除外) |
混贴票据识别 | 对增值税发票、卷票、火车票、出租车票、行程单等7类票据混贴的图片进行切分识别 |
银行回单识别 | 对各大银行的收/付款人户名、账号、开户银行、金额、日期等关键字段进行结构化识别 |
增值税发票识别 | 对增值税发票进行文字识别,并结构化返回字段信息,支持增值税专票、普票、电子发票 |
增值税发票验真 | 支持9种增值税发票的真伪及字段信息准确性校验,包括增值税专票、电子专票、普票、电子普票、卷票、通行费增值税电子普票、货运专票、机动车销售发票、二手车销售发票,支持返回票面的全部信息 |
定额发票识别 | 对各类定额发票、过路过桥费专用发票代码、号码、金额进行识别 |
通用机打发票识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】对国家/地方税务局发行的横/竖版通用机打发票的号码、代码、日期、合计金额、类型、商品名称字段进行结构化识别 |
火车票识别 | 支持对大陆火车票的车票号、始发站、目的站、车次、日期、票价、席别、姓名进行结构化识别 |
出租车票识别 | 针对全国各大城市出租车票的发票号码、发票代码、车号、日期、时间、金额进行结构化识别 |
飞机行程单识别 | 对飞机行程单中的姓名、始发站、目的站、航班号、日期、票价字段进行结构化识别 |
汽车票识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】对全国范围内不同版式的汽车票进行结构化识别,包括发票代码、发票号码、到达站、出发站、日期、时间、金额、身份证号、姓名9个字段 |
过路过桥费发票识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】对全国范围内不同版式的过路费、过桥费发票进行结构化识别,包括发票代码、发票号码、入口、出口、日期、时间、金额7个字段 |
船票识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】对全国范围内不同版式的客运船票、货运船票进行结构化识别,包括发票代码、发票号码、发票日期、发票类型、总金额、出发地点、到达地点7个字段 |
彩票识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】对大乐透、双色球彩票进行识别,并按行返回识别结果 |
保险单识别 | 对各类人身保险保单中投保人、受益人的各项信息、保费、保险名称等字段进行结构化识别 |
通用票据识别 | 对各类票据图片进行文字识别,并按行(半结构化)返回文字在图片中的位置信息 |
医疗票据文字识别 | 对医疗场景各类票据进行结构化识别,按字段返回识别结果 |
医疗发票文字识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】支持识别全国各地门诊/住院发票的业务流水号、发票号、住院号、病例号、姓名、性别、社保卡号、金额大/小写等16 个关键字段 |
医疗费用结算单识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】支持识别全国各地病案首页的病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等15 个关键字段 |
病案首页识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】支持识别全国各地病案首页的病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等15 个关键字段 |
教育场景文字识别 | 针对教育相关场景所涉及的文字、数字、符号进行识别 |
手写文字识别 | 对手写汉字或手写数字进行识别 |
公式识别 | 对试卷中的数学公式及题目内容进行识别 |
汽车场景文字识别 | 针对汽车相关场景的各类证件、票据结构化识别 |
车牌识别 | 对机动车蓝牌、绿牌、单/双行黄牌的车牌号码进行识别,并能同时识别图像中的多张车牌 |
VIN码识别 | 对车辆车架、挡风玻璃上的VIN码进行识别 |
驾驶证识别 | 对机动车驾驶证正本所有9个字段进行结构化识别 |
行驶证识别 | 对机动车行驶证主页及副页所有21个字段进行结构化识别 |
机动车销售发票识别 | 对机动车销售发票的号码、代码、日期、价税合计等26个关键字段进行结构化识别 |
车辆合格证识别 | 对车辆合格证的编号、车架号、排放标准、发动机编号等23个关键字段进行结构化识别 |
其它场景文字识别 | 对一些特殊场景所涉及图片中的文字内容进行识别 |
智能结构化识别 | 【请点击申请邀测提交需求申请开通该接口使用权限】结构化识别各类卡证、票据,无需配置结构化对应关系、无需提取关键词、无需定制开发,直接上传图片即可获得结构化识别信息 |
仪器仪表盘读数识别 | 广泛适用于各类血糖仪、血压仪、燃气表、电表等,可识别表盘上的数字、英文、符号 |
印章检测 | 【请点击申请邀测提交需求申请开通该接口使用权限】对合同文件或常用票据中的印章进行检测,并返回其位置信息 |