当前位置: 首页 > 常见问题 > Word文档

java读取word内容,java读取word中的附件

  • Word文档
  • 2023-09-02

java读取word内容?java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估 计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,那么,java读取word内容?一起来了解一下吧。

java替换pdf模板中的占位符

通过流来旅镇读取,例如:

TextFileForm fileForm = (TextFileForm) form;FormFile formFile = fileForm.getTxtFile();if (formFile.getFileData().length == 0) {response.setCharacterEncoding("gb2312");和团response.getWriter().write("");}InputStream in = formFile.getInputStream();WordExtractor extractor = new WordExtractor();String str = extractor.extractText(in);这段代码就唤镇橘是负责读取word的

java读取word嵌套表格

可以试一下使用Free Spire.Doc for Java来读取Word内如丛容晌中,代码挺简单的宴橡山,可以参考下这篇教程看下有没有帮助

java如何读取文档

java读取word文档,获取文本内容,保留基本的换行格式。

java用POI对word进行解析。所需jar包,用maven引入

org.apache.poi

poi-scratchpad

3.2-FINAL

前端用webuploader上传控件,限制上传文件类型仅支持text和word.

后台蔽橡MultipartFile接收文件,根据ContentType区分文件类型,区分解析获取文件内容。

word解析:

txt为word的铅并羡槐拍文本内容

java读取word文档内容

如何使用JAVA、POI读写word文档??

能不能将一个word的内容完全读过来,放到一个新生成的word文件中去,要旁高求能将word中的表格、图片等保留,格式不变。最好能给个例子?网上多是很早以前的那个解决方法如下:,只能读文本内容,且新生成的word文件打开时总是要提示选择编码,不太好用,希望能有新的解决方案??!!

poi操作word

1.1 添加poi支持:包地址

1.2 POI对Excel文件的读取操作比较方便,POI还提供对Word的DOC格式文件的读取。但在它的发行版本中没有发布对Word支持的模块,需要另外一个POI的扩展的Jar包。地址为;extractors-0.4_zip这个文件

2、提取散空Doc文件内容

public static String readDoc(String doc) throws Exception {

// 创建输入流读取DOC文件

FileInputStream in = new FileInputStream(new File(doc));

WordExtractor extractor = null;

String text = null;

// 创建WordExtractor

extractor = new WordExtractor();

// 对DOC文件进行提取

text = extractor.extractText(in);

return text;

}

public static void main(String[] args) {

try{

String text = WordReader.readDoc("c:/test.doc");

System.out.println(text);

}catch(Exception e){

e.printStackTrace();

}

}

3、写入Doc文档

import java.io.ByteArrayInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import org.apache.poi.poifs.filesystem.DirectoryEntry;

import org.apache.poi.poifs.filesystem.DocumentEntry;

import org.apache.poi.poifs.filesystem.POIFSFileSystem;

public class WordWriter {

public static boolean writeDoc(String path, String content) {

boolean w = false;

try {

// byte b[] = content.getBytes("ISO-8859-1");

byte b[] = content.getBytes();

ByteArrayInputStream bais = new ByteArrayInputStream(b);

POIFSFileSystem fs = new POIFSFileSystem();

DirectoryEntry directory = fs.getRoot();

DocumentEntry de = directory.createDocument("WordDocument", bais);

FileOutputStream ostream = new FileOutputStream(path);

fs.writeFilesystem(ostream);

bais.close();

ostream.close();

} catch (IOException e) {

e.printStackTrace();

}

return w;

}

public static void main(String[] args) throws Exception{

String wr=WordReader.readDoc("D:\\test.doc");

boolean b = writeDoc("D:\运掘尺\result.doc",wr);

纯Java读取word文档文字内容

通过铅汪流来读好陪取,例如:

TextFileForm fileForm = (TextFileForm) form; FormFile formFile = fileForm.getTxtFile(); if (formFile.getFileData().length == 0) { response.setCharacterEncoding("gb2312"友激蠢); response.getWriter().write(""); } InputStream in = formFile.getInputStream(); WordExtractor extractor = new WordExtractor(); String str = extractor.extractText(in);这段代码就是负责读取word的

以上就是java读取word内容的全部内容,用jacob.jar吧, 读取word还是挺方便的,也可以把word直接转换成HTML或者jsp。而HTML也可以直接用BufferedReader()的方法来读取里面的数据再添加删除你需要的数据再转换成jsp。内容来源于互联网,信息真伪需自行辨别。如有侵权请联系删除。

猜你喜欢