• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    图片识别工具Tesseract初探

    一、框架介绍

    Tesseract 是一款图片识别工具,可以抓取图片中的文字,可以支持多种语言(默认是英语),需要下载开源文件可以在github上下载,如果知识应用不想太多深究直接在google code里边搜索下载即可。

    二、Tesseract内容 

    Doc:说明文档 

    Tessdata:存放各种文字库(chi_sim.traineddata:中文 等) 

    Tessseract.exe 即可以启动文件开始调用Tesseract 可以通过cmd方式调用,先cd到对应的目录,然后 输入 tesseract.exe 图片名 导出文件名(如:tesseract.exe 1.jpg 1) 就可以把和tesseract同目录的 1.jpg文件识别结果存放在 1.txt文件中。当然如果需要支持中文,需要在tessdata中添加 chi_sim.traineddata 文件,

    然后 调用例子:tesseract.exe 1.jpg 1 -L chi_sim 制定是根据什么文字库进行识别。 当然图片地址可以引用全路径、输出结果也可以全路径如果只是想把Tesseract做为一个工具做文字解析,并不追求太高成功率使用者,这样即可满足需要了,直接通过CMD调用exe进行执行。有需要玩的小伙伴可以直接下载附件 Tesseract_简单使用.rar文件

    三、.Net项目高级使用

    如果.Net项目需要使用 DLL方式引用进行研发,可以下载Tesseract_DLL引用包。

    X86和X64是针对Tesseract关联引用DLL,根据程序所在系统位数进行自适应配置。

    liblept168.dll 这个文件会在windows server 2003中发布IIS情况下无法加载错误信息: Failed to find library "liblept168.dll" for platform x86. 如果发布在更高版本系统中即可正常使用Tesseract.DLL即是要添加到对应的项目中的。以下是测试tesseract.dll 代码: 

     using (var engine = new TesseractEngine(Server.MapPath(@"~/tessdata"), "eng", EngineMode.Default))
             {
               // have to load Pix via a bitmap since Pix doesn't support loading a stream.
               using (var image = new System.Drawing.Bitmap(imageFile.PostedFile.InputStream))
               {
                 using (var pix = PixConverter.ToPix(image))
                 {
                   using (var page = engine.Process(pix))
                   {
                     meanConfidenceLabel.InnerText = String.Format("{0:P}", page.GetMeanConfidence());
                     resultText.InnerText = page.GetText();
                   }
                 }
               }
             }
    
    

    TesseractEngine:构造函数参数注意事项=》第一个是字库路径必须使用tessdata结尾,第二个如果需要使用chi_sim即中文

    以上所述就是本文的全部内容了,希望大家能够喜欢。

    您可能感兴趣的文章:
    • Python实现基于PIL和tesseract的验证码识别功能示例
    • python使用Tesseract库识别验证
    • python3.5+tesseract+adb实现西瓜视频或头脑王者辅助答题
    • Python+Selenium+PIL+Tesseract自动识别验证码进行一键登录
    • Java OCR tesseract 图像智能文字字符识别技术实例代码
    • python下调用pytesseract识别某网站验证码的实现方法
    • Perl使用Tesseract-OCR实现验证码识别教程
    • Python3.6使用tesseract-ocr的正确方法
    上一篇:ASP.NET MVC中将控制器分离到类库的实现
    下一篇:ASP.NET动态添加用户控件的方法
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    图片识别工具Tesseract初探 图片,识别,工具,Tesseract,