CAJ是“中国学术期刊全文数据库”(China Academic Journals)的英文缩写,同时也是“中国学术期刊全文数据库”中的一种文件格式。我们从CNKI(知网)下载的资料一般都是这种文件格式。
常规的阅读软件是无法打开CAJ格式的文件,它是知网特有的文件格式。
有的同学说将CAJ文件的后缀名改为.pdf就能打开,这其实是以偏概全,CAJ文件并不是一种格式,而是多种格式,包含caj, kdh, nh, pdf等多种格式,并且即使是pdf格式的caj,有些内部文件也做了变动,导致普通的PDF阅读器无法阅读。
那么我们应该如何打开CAJ文件,哪些软件对读取和转换CAJ有用?
1. 阅读CAJ
CAJ可以直接使用知网官方的CAJViewer阅读器来打开文件,并且可以直接从百度搜索或官方网站下载并安装CAJViewer阅读器,这个软件是免费使用的。
除了阅读CAJ文件功能以外,CAJViewer阅读器还具有将CAJ识别为文本并将其转换为图片的功能。下载安装CAJViewer阅读器后,打开CAJ文件,然后在菜单栏“工具”中单击“文本识别”。按住鼠标并单击鼠标左键以选择需要在文档中识别的部分,该部分将作为文本输出,不过这种方式最多一次只能识别一页内容,无法批量处理。
单击菜单栏“工具”下的“选择图像”,或直接单击导航栏中的“选择图像”工具,圈出文档范围,然后单击鼠标右键可将其以图片形式发送给Word,同样的,它一次也只能处理一页的内容,无法批量处理。
2. CAJ 转换
从前文可以看到,使用CAJ文件虽然可以处理文字识别,但是效率极其低下,一次只能处理一页,并且还需要依赖CAJ阅读器,不是非常方便,并且非常耗时。我们可以使用一些三方工具进行转换,省时省力,方便很多。
在线网站易转换提供了CAJ转PDF和CAJ图文识别转Word的功能。网络搜索“易转换”,进入易转换首页,可以看到CAJ转换相关的功能,包含CAJ转PDF,CAJ转Word,CAJ文字识别等,实际上顶部还有一个菜单知网CAJ,包含了更多的功能,有兴趣的小伙伴可以自己点开看一看。
如果只是想把CAJ转换为PDF文件,那么就选择CAJ转PDF,如果是想转换为Word文件,最好选择CAJ文字识别。我们以CAJ文字识别为例:
1. 进入CAJ文字识别页面,选择CAJ文件,并通过下拉框选择需要转换的文件类型DOCX
2. 点击智能转换,开始对文件进行处理,这一步可能时间会比较长,文字识别可是相当耗费机器性能的,如果等不到任务结束,稍后去我的文件中,可以获得下载地址。
3. 转换成功后,即可点击下载按钮下载生成好的Word文件
CAJ转PDF功能传送门:https://www.easeconvert.com/caj-to-pdf/
CAJ图文识别转Word功能传送门:https://www.easeconvert.com/caj-ocr-word/