> CentOS > CentOS教程 >

Centos下编译安装TESSERACT3.0.x版本

因为centos自带的低版本TESSERACT无法识别中文,所以我们来说说如何在centos下编译安装TESSERACT的最新版本。

1.首先我们来安装TESSERACT所需要的依赖库leptonica

 
1
2
3
4
wget https://leptonica.googlecode.com/files/leptonica-1.69.tar.gz
tar -zxvf leptonica-1.69.tar.gz
cd leptonica-1.69
./configure; make; make install

2.编译安装TESSERACT的最新版本

 
1
2
3
4
5
6
7
cd ..
wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
tar -zxvf tesseract-ocr-3.02.02.tar.gz
cd tesseract-ocr
./autogen.sh                            
./configure                          
make; make install

3.安装中文和英文的识别库

 
 
Shell
 
1
2
3
4
5
6
cd ..
wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
tar -zxvf tesseract-ocr-3.02.eng.tar.gz
wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.chi_sim.tar.gz
tar -zxvf tesseract-ocr-3.02.chi_sim.tar.gz
mv tesseract-ocr/tessdata/* /usr/local/share/tessdata/

如果需要其他语言的识别库,请访问TESSERACT的下载页下载。

(责任编辑:IT)