java读取word内容?java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估 计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,那么,java读取word内容?一起来了解一下吧。
通过流来旅镇读取,例如:
TextFileForm fileForm = (TextFileForm) form;FormFile formFile = fileForm.getTxtFile();if (formFile.getFileData().length == 0) {response.setCharacterEncoding("gb2312");和团response.getWriter().write("");}InputStream in = formFile.getInputStream();WordExtractor extractor = new WordExtractor();String str = extractor.extractText(in);这段代码就唤镇橘是负责读取word的
可以试一下使用Free Spire.Doc for Java来读取Word内如丛容晌中,代码挺简单的宴橡山,可以参考下这篇教程看下有没有帮助
java读取word文档,获取文本内容,保留基本的换行格式。
java用POI对word进行解析。所需jar包,用maven引入
前端用webuploader上传控件,限制上传文件类型仅支持text和word.
后台蔽橡MultipartFile接收文件,根据ContentType区分文件类型,区分解析获取文件内容。
word解析:
txt为word的铅并羡槐拍文本内容
如何使用JAVA、POI读写word文档??
能不能将一个word的内容完全读过来,放到一个新生成的word文件中去,要旁高求能将word中的表格、图片等保留,格式不变。最好能给个例子?网上多是很早以前的那个解决方法如下:,只能读文本内容,且新生成的word文件打开时总是要提示选择编码,不太好用,希望能有新的解决方案??!!
poi操作word
1.1 添加poi支持:包地址
1.2 POI对Excel文件的读取操作比较方便,POI还提供对Word的DOC格式文件的读取。但在它的发行版本中没有发布对Word支持的模块,需要另外一个POI的扩展的Jar包。地址为;extractors-0.4_zip这个文件
2、提取散空Doc文件内容
public static String readDoc(String doc) throws Exception {
// 创建输入流读取DOC文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对DOC文件进行提取
text = extractor.extractText(in);
return text;
}
public static void main(String[] args) {
try{
String text = WordReader.readDoc("c:/test.doc");
System.out.println(text);
}catch(Exception e){
e.printStackTrace();
}
}
3、写入Doc文档
import java.io.ByteArrayInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import org.apache.poi.poifs.filesystem.DirectoryEntry;
import org.apache.poi.poifs.filesystem.DocumentEntry;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
public class WordWriter {
public static boolean writeDoc(String path, String content) {
boolean w = false;
try {
// byte b[] = content.getBytes("ISO-8859-1");
byte b[] = content.getBytes();
ByteArrayInputStream bais = new ByteArrayInputStream(b);
POIFSFileSystem fs = new POIFSFileSystem();
DirectoryEntry directory = fs.getRoot();
DocumentEntry de = directory.createDocument("WordDocument", bais);
FileOutputStream ostream = new FileOutputStream(path);
fs.writeFilesystem(ostream);
bais.close();
ostream.close();
} catch (IOException e) {
e.printStackTrace();
}
return w;
}
public static void main(String[] args) throws Exception{
String wr=WordReader.readDoc("D:\\test.doc");
boolean b = writeDoc("D:\运掘尺\result.doc",wr);
通过铅汪流来读好陪取,例如:
TextFileForm fileForm = (TextFileForm) form; FormFile formFile = fileForm.getTxtFile(); if (formFile.getFileData().length == 0) { response.setCharacterEncoding("gb2312"友激蠢); response.getWriter().write(""); } InputStream in = formFile.getInputStream(); WordExtractor extractor = new WordExtractor(); String str = extractor.extractText(in);这段代码就是负责读取word的
以上就是java读取word内容的全部内容,用jacob.jar吧, 读取word还是挺方便的,也可以把word直接转换成HTML或者jsp。而HTML也可以直接用BufferedReader()的方法来读取里面的数据再添加删除你需要的数据再转换成jsp。内容来源于互联网,信息真伪需自行辨别。如有侵权请联系删除。