为什么喝酒后会头疼| 奇亚籽在中国叫什么| cos代表什么意思| 支付宝余额和余额宝有什么区别| 红苋菜不能和什么一起吃| 肝五行属什么| 乳酸菌素片什么时候吃| 占有欲是什么意思| 胸闷心慌是什么病| 男字五行属什么| 强直性脊柱炎有什么症状| 女人小便出血是什么原因| 蹲着有什么好处| 什么时候做四维| 菜肴是什么意思| 口扫是什么| 额头上有痣代表什么| 咽炎吃什么好| 白羊男喜欢什么样的女生| 右小腿抽筋是什么原因| 麦粒肿是什么| 早上空腹喝淡盐水有什么好处| 兔配什么生肖最好| 多吃蔬菜对身体有什么好处| 眼底出血是什么原因引起的| 福荫是什么意思| 口字五行属什么| 梦见自己离婚是什么预兆| 低密度脂蛋白胆固醇偏高是什么意思| 肺炎是什么| 甘油三酯是什么| 欧代是什么| 血吸虫是什么动物| 跖围是什么意思| 2017什么年| 鲜卑人是现在的什么人| 拔了牙吃什么消炎药| 老年人脚肿是什么原因引起的| 男性吃什么生精快| 鼠加句念什么| 梦见自己给自己理发是什么意思| 血清胰岛素测定查什么| 胃窦炎吃什么药最好| 气是什么生肖| 骨刺是什么| 人工流产和无痛人流有什么区别| 整编师和师有什么区别| 附骨疽在现代叫什么病| 黄金为什么这么贵| ipa啤酒什么意思| 什么是尿潴留| 抄手是什么| 清明是什么意思| sharon是什么意思| 不射精是什么原因| apc是什么药| 小便发黄是什么症状| 肛门裂口是用什么药膏| 女人左手心痒预示什么| 孔子姓什么名什么| 今天开什么奖| 月经提前十天是什么原因| 打飞机什么意思| 鼻子流清水是什么原因| 夫妻肺片是什么| 板命什么意思| 10月12号是什么星座| 省长是什么级别干部| 或缺是什么意思| 长痘痘用什么药| 场景是什么意思| 口腔溃疡是什么| 什么叫韵母| 洗牙有什么好处和坏处| 做梦梦到很多蛇是什么意思| 水代表什么数字| 莫拉古是什么意思| 10月24号是什么星座| 突然嗜睡是什么原因造成的| 袍哥什么意思| 月经期生气会造成什么后果| 伪军是什么意思| 什么是三观不合| 梦见什么是怀孕的征兆| pda是什么意思| 吃什么对胰腺好| 北京佑安医院擅长什么| 为什么感冒会流眼泪| metoo是什么意思| 蜂蜜芥末酱是什么味道| 牙根疼吃什么药| 冠状沟是什么| 脸上长粉刺是什么原因引起的| 肌肉劳损吃什么药| 安全套是什么| 疝气是什么症状| 清洁度三度什么意思| 头晕是什么情况| 射手座喜欢什么样的女生| 巨人观是什么| 梦到好多蛇是什么意思| 龙凤胎是什么意思| 冷暖自知上一句是什么| 俄罗斯用什么货币| 查输卵管通不通做什么检查| audrey是什么意思| 孩子一直咳嗽不好是什么原因| 骨扫描是检查什么| 胰岛素是什么意思| 皮肤一块白一块白的是什么原因| aj是什么意思| 玻璃瓶属于什么垃圾| 狮子座上升星座是什么| 四五行属什么| 手脚发麻是什么原因| 夏天适合吃什么食物| 什么魏什么赵| 观音坐莲什么意思| 花枝招展是什么意思| 甲基化是什么意思| 震颤是什么病| 什么是溶血性疾病| 佑字五行属什么| 肛门坠胀吃什么药最好| 眼睛经常有眼屎是什么原因| 狗狗为什么会得细小| 梦见把蛇打死了是什么意思| 处女膜破了有什么影响| 纳甲是什么意思| 膀胱壁增厚毛糙是什么意思| 汲汲营营是什么意思| 白球比偏低是什么意思| 站桩有什么好处| vip是什么意思| 免去职务是什么意思| 恚是什么意思| 减肥期间早餐应该吃什么| 李白有什么诗| 地米是什么药| 性欲是什么意思| 廿年是什么意思| 多吃核桃有什么好处和坏处| 低钾是什么原因造成的| 盐酸利多卡因注射作用是什么| 提供什么| 马步鱼为什么是甜的| 中焦不通用什么中成药| 没晨勃说明什么问题| 滴虫性阴炎用什么药效果最好| 腿上的肉疼是什么原因| 虫合读什么| 张的五行属性是什么| 云裳是什么意思| 眼睛长黄斑是什么原因| 乸是什么意思| 梦见雪是什么意思| 平方是什么意思| 双脚踝浮肿是什么原因| 做胃镜之前需要做什么准备| 陈皮有什么功效作用| 什么叫做原发性高血压| 阿飞是什么意思| 肺气肿吃什么药最有效| 卵泡破裂有什么症状| 有张有弛是什么意思| 剪什么样的发型好看| 甲状腺是什么| 黄梅时节是什么季节| 谷草转氨酶高吃什么药| dr检查是什么| 荷兰机场叫什么| 耳朵听不清楚是什么原因| 手脚发热什么原因| 冥币是什么意思| 4ever是什么意思| 芝柏手表什么档次| 观音菩萨的坐骑是什么| 苹果手机为什么那么贵| 咽喉炎吃什么消炎药| 吃饭睡觉打豆豆是什么意思| me是什么基团| 什么的挑选| 为什么去香港还要通行证| 素肉是什么| 早上七点是什么时辰| 限量版是什么意思| 519是什么星座| 卵巢早衰是什么意思| 一落千丈是什么生肖| 希五行属什么| 口发苦是什么原因| 33代表什么意思| 均匀是什么意思| 188是什么意思| 什么花一年四季都开花| 女生是党员有什么好处| 腿硬邦邦的是什么原因| 蒙脱石散适合什么腹泻| 胸变大是什么原因| 巴宝莉属于什么档次| 手筋痛是什么原因| 手指关节痛是什么原因| 17号来月经什么时候是排卵期| 扁桃体溃疡吃什么药| 睡眠不好会引起什么症状| 怀孕了胃不舒服是什么原因| 认识是什么意思| 经常吃秋葵有什么好处| 红枣泡水喝有什么好处| 人体第一道防线是什么| 督导是什么| 手心发热吃什么药| 肩膀发麻是什么原因| 咳嗽无痰吃什么药| 备孕吃什么水果| 乙肝携带者是什么意思| 吃什么增强免疫力最快| 头臀长是什么意思| 什么叫射线| iga肾病是什么病| 闪光眼是什么症状| 幼对什么| 龟头上抹什么药能延时| 高同型半胱氨酸血症是什么病| 施华洛世奇算什么档次| 什么是轻断食| 黑脸是什么意思| 万足读什么| 肠梗阻是因为什么原因引起的| 梦见彩虹是什么征兆| 芭乐是什么季节的水果| 有朝一日是什么生肖| 肺炎衣原体和支原体有什么区别| 佛牌是什么| 肺肿瘤吃什么好| 阳阴阳是什么卦| 诸事皆宜是什么意思| 云南白药的保险子是起什么作用的| lga是什么意思| 自助是什么意思| 什么是数字货币| 赵本山什么时候死的| 抑制素b检测是什么意思| 喝什么减肥| 胃镜后吃什么| 夜里2点到3点醒什么原因| 五加一笔是什么字| 三庚是什么意思| 什么时候拔罐最好| 心悸是什么意思| 压疮用什么药最快能好| 玳瑁色是什么颜色| 指鼻试验阳性代表什么| 儿童拖鞋什么材质好| 玉和翡翠有什么区别| 什么时候放假| 戴芬是什么药| 不孕不育有什么症状女| 血线高是什么意思啊| 偶像是什么意思| 疑虑是什么意思| 8月30号什么星座| 为什么每天晚上睡觉都做梦| 蜻蜓是什么目| 百度
资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

生态强省建设·千万亩森林增长工程--安徽频道--人民网

Q:什么是自定义模板文字识别?什么场景下我该使用这个产品?

A:自定义模板文字识别是一款您可以针对各种票据、卡证实现字段名和字段值对应提取的OCR产品;举例:当您需要识别某一种证件(比如房产证),但是百度官方还没有针对这种类型的证件推出具体的模板识别接口,而使用通用文字识别无法实现字段名和字段值对应化的提取,这种情况下您可以使用自定义模板文字识别产品,实现结构化的数据提取。

Q:产品实现的原理是什么?

A:基本原理:如果您要识别特定的一类具有固定格式的文档,首先上传一张票据、卡证的图片作为模板(用于制作模板的图片要求摆放端正、平整,拍摄时避免过曝,阴影等不良情况),然后在模板上框选一些固定的字段作为【参照字段】。后续调用识别接口时,会将新上传的图片以【参照字段】为锚点扭正到和模板图片一致。最后框选需要识别的区域作为【识别区】,框选后在右侧给该识别区命名,点击保存,这便完成了一个模板的制作。

Q:自定义模板文字识别支持哪些浏览器?

A:推荐使用Chrome(版本58及以上),暂时不支持Safari。

Q:上传的图片有大小限制吗?上传什么样的图片效果会比较好?

A:上传用于模板制作的图片,最大:小于等于4M,且分辨率小于等于4096像素乘4096像素,最小:大于等于15像素乘15像素且大于等于1KB,后期上传识别的图片最大:大小不超过4M,且分辨率小于等于4096像素乘4096像素,最小:大于等于15像素乘15像素且大于等于1KB。 为了保证更好的效果,建议模板图片:

  1. 模板图片清晰平整,摆放端正
  2. 模板图片格式以 .jpg 为最佳,png、bmp格式识别效果欠佳
  3. 模板图片尽量突出需要识别的部分,请先手动剪裁掉不需要的部分,提高识别率
  4. 模板图片大小建议为:转为base64编码后不超过1M,不宜过大或过小
  5. 模板图片中,大多数汉字的大小保持在 32*32像素 左右,不符合的整体缩放调整

Q:我该怎么使用自定义模板文字识别?

A:首先您需要制作您的模板,在Chrome中打开 ai.baidu.com/iocr 进入模板管理界面,此时需要您首先登录百度账号(和您的百度网盘、百度贴吧、百度文库等百度系产品通用),进入后点击创建模板,进入模板编辑界面,首先您需要给您的模板进行命名,然后点击左侧编辑框中的按钮上传模板图片(模板图片要求端正、清晰),然后框选字段值,框选后在右侧对应位置填写字段名,全部框选完后点击右侧“参照字段”标签,在图中框选参照字段(要求参见下一条Q&A),完成后点击保存,则您已经制作完您的模板,此时您可以点击“发布”按钮,把次模板发布到线上环境(保存只是保存修改记录,不会实时生效,发布后您的所有操作才会生效),然后您可以参照文档中的“请求说明”上传图片,并制定templateSign(模板标识),来指定上传的图片使用该模板。

视频教程请参见 iOCR通用版使用教程(视频版)

Q:模板制作过程中怎么进行图片的缩放?

A:可以使用工具栏中的放大缩小工具,或使用鼠标滚轮,或使用触摸板(如果您的设备具有触摸板)进行双指缩放。

Q:什么是参照字段,选取时有什么注意点?

A:为了将您后期上传的图片矫正成和您模板图片以在同样的位置区间寻找关键值,您需要在制作模板的时候在“参照字段”标签页下框选至少4个(推荐框选8个以上)的参照字段,参照字段的选取需要点击编辑模板界面右上角工具栏中的“设置参照字段”工具,然后在图上拖动选取固定文字。 框选时有一些注意点:

  • 同一参照字段的文字必须在同一行;
  • 参照字段必须是模板图片和后期上传的图片中共同拥有并且内容和位置都不变的文字;
  • 参照字段尽量四散在图片的边缘,尤其是四角;
  • 参照字段尽量在模板图片上唯一,在图片中多次出现的文字段效果较差;
  • 参照字段尽量,至少4个,强烈推荐标注8个以上的参照字段,参照字段越多越分散识别效果越好;
  • 如果后期测试时显示“未匹配到模板”则是因为参照字段选取和识别的问题,请按照上述要求检查核对并重新选取参照字段。

Q:框选参照字段的时候发现识别错了,可以纠正吗?

A:可以的,您可以点击参照字段后面的编辑按钮,对参照字段进行人工纠正,输入正确的文字内容。修改正确参照字段的内容有助于提升后期模板匹配效果。纠正的规则是:

  • 不能添加/删除超过两个字符,并且如果您框选的参照字段范围比较小,无法放下新增的两个字符,则您需要适当扩大该参照字段的框选范围
  • 跨行的参照字段无法编辑,请先改为框选单行文字
  • 不能将参照字段内容删除为空

Q:框选识别区时有什么办法可以提高准确率?

A:如果您选择的识别区内容正好为以下表格中的某一项,您可以选择对应的字段类型来提升识别效果:

字段属性 适用范围 输出结果
常规 适用于全场景识别,
如果该切片属于下列属性中任意一个,
建议使用下面的切片属性来提高准确率
识别区所有内容
小写数字金额 各类票据中金额数字 结果只返回至少包含小数点后两位的数值(不满两位则默认补充为##.00)并且会忽略所有的非数字以外的文字和符号(也会丢弃¥、$)
日期 单个日期如2025-08-04 结果会做归一化处理统一以20180719格式返回
长串数字 如运单号、票号 结果只返回长串数字、英文组合
手写汉字 手写中文汉字 该识别区进行全量识别,但是对手写汉字有较高的准确率
手写数字 手写阿拉伯数字 该识别区进行全量识别,但是对手写数字有较高的准确率
数字/英文/符号混合 发票密码区 识别区所有内容,相比于“常规”识别率更高
我的字段类型 您可以在【字段类型管理】
中为字段值是有限集合的字段上传词典,
限定输出范围
智能匹配后的词典值

Q:在框选字段值/框选参照字段的时候不小心多点击增加了一个错误的选择框,应该怎么删除?

A:可以点击右侧的“识别区”/“参照字段”下面对应字段后的X按钮进行删除。

Q:有些识别区容易漏字、识别不准怎么办?

A:在对应识别区的“字段类型”中选择“数字/英文/符号混合”可以提高该字段的识别效果。

Q:保存和发布是什么关系/发布是用来干嘛的?

A:考虑到很多用户会把自己制作的模板使用到业务中去,所以为了尽可能的保证您业务的连续性,我们的模板编辑完后点击保存时只是把您的编辑操作保存到云端,此时,您线上使用的模板还是您之前的模板,直至您对刚才的模板进行发布操作。举例:您在2月1日生成了A模板,并点击发布,此时您调用这个接口时是使用的2月1日的A模板,然后您在3月1日对模板进行了修改,点击了保存,此时您在3月1日的所有编辑操作都已经保存在云端,但是您线上使用的模板仍然是2月1日的A模板,如果您需要使用3月1日的模板去替换2月1日的版本,您需要对3月1日编辑过的A模板进行发布操作,当您点击发布以后,您调用这个接口使用的将会是3月1日编辑的A模板。

Q:修改历史是什么?/我能回退到之前某个版本吗?

A:点击“修改历史”右侧的小箭头即可展开这个模板的版本记录,版本记录从新到旧列出了您针对这个模板修改的各个版本,您可以点击对应版本右侧的“退回到此刻”来将模板回退到当时那个版本,您框选的取值范围、参照字段都会回退到当时版本的设置,但是您的模板名字不会因此回退。

Q:制作完模板以后我可以给模板改名字吗?回退到其他版本的时候名字也会回退吗?

A:您可以在模板编辑页面随时修改您的名字,修改完名字以后需要您点击保存,此时会生成一个新的版本;在您回退到过去的某个版本的时候模板名字不会回退。

Q:分类时是否数据越多越好?

A:不一定,我们建议您每个模板提供30张同模板的训练集,如果您训练图片较丰富可以提供100张以下的图片,每张图片建议不超过500kb,选择的图片要尽量覆盖到使用的场景。同时更多的图片会导致训练时间加长。

Q:分类的细粒度大概是什么样的?

A:现在分类的细粒度为视觉元素层面有较明显的区分的图片,如身份证、银行卡、户口本这些人类能快速区分开的卡证、票据。但是无法做到需要根据文字内容来进行区分的地步,如:无法区分北京增值税专票和天津增值税专票。

Q:分类时训练数据不很是很多,能否用同一张照片PS处理成多张不同的图片来进行训练?

A:非常不建议您这么做。这样拟合出来的分类器模型没有很强的泛化能力,分类的准确性会大幅下降。我们还是建议您使用真实场景中需要分类的数据进行训练。

Q:为什么训练以后显示准确率100%,但是还会有分类错误的情况呢?

A:界面上显示的分类器的准确率预估是基于少量测试图片得出的结论,只代表在该测试集下的准确率。

Q:训练完的分类器预测的准确率不高是什么原因?

A:主要是训练数据的问题,包括: 1.某个模板的训练集中混杂了其他类型的图片; 2.训练集数据较少或过于单一没有很好覆盖全实际场景; 3.需要分类的不同模板区别不明显,如北京增值税专票和天津增值税专票 针对上述情况的解决方案如下:

  • 1.检查每个模板的训练集,确保训练集中的图片属于同一个模板;
  • 2.增加训练集中的图片数量,尽量覆盖实际使用时可能会遇到的场景;
  • 3.只是文字内容级别的不同模板建议使用通用文字识别的结果作为参考进行分类。
上一篇
iOCR财会版
下一篇
错误码
腱鞘炎要挂什么科 女人梦见狗是什么预兆 礼金是什么意思 任达华是什么生肖 池字五行属什么
节哀顺便是什么意思 家严是什么意思 人生导师是什么意思 失信名单有什么影响 胸是什么
处男什么意思 人流是什么意思 气结是什么意思 摆地摊卖什么最赚钱而且很受欢迎 肠胃炎吃什么消炎药
古尔丹代价是什么 减肥可以吃什么主食 喉咙干是什么原因 什么的青蛙 马车标志是什么品牌
总lge是什么hcv8jop9ns7r.cn 惨绿少年什么意思hcv8jop1ns1r.cn 洛五行属性是什么jingluanji.com 用什么拖地最干净wuhaiwuya.com 口腔挂什么科hcv8jop4ns2r.cn
七夕节是什么时候hcv8jop8ns4r.cn 惹是什么意思hcv7jop5ns5r.cn 脚掌发麻是什么原因hcv9jop4ns4r.cn 什么车不能坐hcv8jop7ns2r.cn 什么时候可以上环最好的hcv8jop3ns2r.cn
装修公司名字取什么好naasee.com 什么是穿刺检查hcv8jop9ns0r.cn 白痰多是什么原因hcv7jop6ns8r.cn 下眼袋浮肿是什么原因hcv8jop3ns7r.cn 临兵斗者皆阵列在前什么意思hanqikai.com
向日葵的花语是什么helloaicloud.com 辣木籽有什么功效hcv8jop7ns7r.cn 县人大主任是什么级别hcv9jop6ns6r.cn 鳞状上皮乳头状瘤是什么hcv8jop0ns0r.cn 头部ct挂什么科hcv8jop0ns6r.cn
百度