<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
  <channel>
    <title>linleran</title>
    <description></description>
    <link>http://linleran.javaeye.com</link>
    <language>UTF-8</language>
    <copyright>Copyright 2003-2008, JavaEye.com</copyright>
    <docs>http://blogs.law.harvard.edu/tech/rss</docs>
    <generator>JavaEye - 做最棒的软件开发交流社区</generator>
      <item>
        <title>有否java版的中文OCR</title>
        <author>linleran</author>
        <description>
          <![CDATA[
          <br/>
          作者: <a href="http://linleran.javaeye.com">linleran</a>&nbsp;
          链接：<a href="http://linleran.javaeye.com/blog/222679" style="color:red;">http://linleran.javaeye.com/blog/222679</a>&nbsp;
          发表时间: 2008年08月01日
          <br/><br/>
          声明：本文系JavaEye网站发布的原创博客文章，未经作者书面许可，严禁任何网站转载本文，否则必将追究法律责任！
          <br/><br/>
          目前项目有个业务，需要将扫描件的文本进行提取，扫描件是中文，市面是有没有比较好的中文OCR提供API，最好是java的，哪个厂商比较好，多少钱。当然如果有开源的最好。<br />关于java写的OCR好像讨论的很少，google上搜了下，发现基本都是c/c++的<br />开源的主要有：<br />tesseract-ocr：http://code.google.com/p/tesseract-ocr/<br />GOCR：http://jocr.sourceforge.net/<br />有个付费的：<br />javaocr：http://www.javaocr.com/<br />但以上都是只支持英文，这次项目里有个业务，需要提取扫描件的文本，不知道有没有厂商开发API，费用多少？
          <br/>
          <span style="color:red;">
            <a href="http://linleran.javaeye.com/blog/222679#comments" style="color:red;">本文的讨论也很精彩，浏览讨论>></a>
          </span>
          <br/><br/><br/>
          <span style="color:#E28822;">JavaEye推荐</span>
          <br/>
          <ul class='adverts'><li><a href='/adverts/41' target='_blank'><span style="color:red;font-weight:bold;">北京: 千橡集团暨校内网诚聘软件研发工程师</span></a></li><li><a href='/adverts/42' target='_blank'><span style="color:red;font-weight:bold;">搜狐网站诚聘Java、PHP和C++工程师</span></a></li></ul>
          <br/><br/><br/>
          ]]>
        </description>
        <pubDate>Fri, 01 Aug 2008 11:13:05 +0800</pubDate>
        <link>http://linleran.javaeye.com/blog/222679</link>
        <guid>http://linleran.javaeye.com/blog/222679</guid>
      </item>
  </channel>
</rss>