找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 13|回复: 0

tikaapp.jar包

[复制链接]

32万

主题

0

回帖

96万

积分

超级版主

积分
964681
发表于 2025-3-14 11:06:15 | 显示全部楼层 |阅读模式
软件标签:  tikaapp.jar   .jar
tikaapp.jar包是一款可以轻松提取文本正文工具,它集成了poi, pdfbox 并且为文本抽取工作提供了一个统一的界面,提供了便利的扩展api,用来丰富其对第三方文件格式的支持,感兴趣的朋友可以下载使用!
tikaapp.jar包简介
tika是一个用于文本解释的框架,其本身并不提供任何的库用于解释文本,而是调用各种各样的库,如poi,pdfbox等。使用tika,可以提取文件中的作者、标题、创建时间、正文等内容,相比于java.io自带的一些功能。



tika app 1.6.jar使用方法
1.进入tika所有的目录,运行以下命令:java -jar "tika-app-1.5 (1).jar" -g

2.tika的图形界面被打开,然后找开file-openurl:

3.点击确认后,即返回解释结果。默认情况下显示的是文本的元信息

4.可以通过view菜单中的选项,分别查看 metadata, formatted text, plain text, main content, stuctured text等信息。


aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|ziyuan80.com

GMT+8, 2025-8-17 10:39 , Processed in 0.075151 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表