马克思恩格斯选集第一卷 可搜索版.htm (1.6 MB)
目前只做了第一卷。
打算一天做一卷。
识别的效果不是很好,因为文字不是很清晰。
我个人觉得应该排一下版。比如把文章中间的页码去掉,段与段之间空行等。
这方面工作不是很紧急因为中马库有相关文章
《共产党宣言》还有《国家与革命》都是被改过的了
如果同志不打算干这事的话那应该我录入完那些照片后就会来干了(虽然目前进度很慢)
我去掉页码和段落加行可以用脚本解决。
但是错字仍然要用眼睛看。差不多每页都有错字(用最好的AI了)。
政治经济学基础知识那本先校对。
我校对前半部分
对的,我用的百度AI来录入,但是基本上每张照片都有十个上下的错字,这是制约我速度的主要原因。
可以。你校对到多少页。
我用的高精度版AI,
《政治经济学基础知识》基本没错字。
我校对到了原书第100页。
原来提示框中的字用斜体表示。