当前位置: 首页 > 常见问题 > Word文档

html导出word,html怎么保存为word

  • Word文档
  • 2023-08-04

html导出word?HTML文档转换为Word文档方法如下:打开文档管理器 选择需要转换的文档 右键-重命名 后缀改为'.doc'或'.docx'保存后右键打开方式选择word 完成 拓展阅读:超文本标记语言,标准通用标记语言下的一个应用。那么,html导出word?一起来了解一下吧。

html转成word

php将html转成word的方法:首先安装zip.dll压返槐缩扩展;然后将规定好了的xml压缩成一个zip包;最后把后缀名改成doc或者docx即可。

推荐漏汪友:《PHP教程》

php实现将HTML页面转换成word并且保存的方法

这里用陵芦使用到一个PHP的叫:PHPWord。

生成Word的原理是,将堆规定好了的xml压缩成一个zip包,并且把后缀名改成doc或者docx即可。

所以使用PHPWord,需要你的PHP环境安装zip.dll压缩扩展,我写了一个demo.

功能说明:

20150507 — HTML中的

标签和

    列表标签的获取

    20150508 — 新增获取文章中的图片功能

    20150509 — 新增行间距,并且过滤一下错误图片

    20150514 — 新增表格处理,并且将代码改成面向对象

    20150519 — 新增GD库处理网络图片

    require_once 'PHPWord.php';

    require_once 'SimpleHtmlDom.class.php';

    class Word{

    private $url;

    private $LinetextArr = array();

    public $CurrentDir;

    public $error = array(); //错误数组

    public $filename = null;

    public $Allowtag = "p,ol,ul,table";

    /**数据统计**/

    public $DownImg = 0;

    public $expendTime = 0;

    public $HttpRequestTime = 0;

    public $ContentLen = 0;

    public $HttpRequestArr = array();

    public $expendmemory = 0;

    public function __construct($url)

    {

    $startTime = $this->_Time();

    $startMemory = $this->_memory();

    $this->url = $url;

    $UrlArr = parse_url($this->url);

    $this->host = $UrlArr["scheme"]."://".$UrlArr['host'];

    $this->CurrentDir = getcwd();

    $this->LinetextArr["table"] = array();

    $html = new simple_html_dom($this->url);

    $this->HttpRequestArr[] = $this->url;

    $this->HttpRequestTime++;

    foreach($html->find($this->Allowtag) as $key=>$value)

    {

    if($value->tag == "table")

    {

    $this->ParseTable($value,0,$this->LinetextArr["table"]);

    }

    else

    {

    $this->AnalysisHtmlDom($value);

    }

    $this->error[] = error_get_last();

    }

    $endTime = $this->_Time();

    $endMemory = $this->_memory();

    $this->expendTime = round(($endTime-$startTime),2); //微秒

    $this->expendmemory = round(($endMemory-$startMemory)/1000,2); //bytes

    $this->CreateWordDom();

    }

    private function _Time()

    {

    return array_sum(explode(" ", microtime()));

    }

    private function _memory()

    {

    return memory_get_usage();

    }

    /**

    * 解析HTML中的Table,这里考虑到多层table嵌套的情况

    * @param $value HTMLDOM

    * @param $i 遍历层级

    * **/

    private function ParseTable($value,$i,$Arr)

    {

    if($value->firstChild() && in_array($value->firstChild()->tag,array("table","tbody","thead","tfoot","tr")))

    {

    foreach($value->children as $k=>$v)

    {

    $this->ParseTable($v,$i++,$Arr);

    }

    }

    else

    {

    foreach($value->children as $k=>$v)

    {

    if($v->firstChild() && $v->firstChild()->tag != "table")

    {

    $Arr[$i][] = array("tag"=>$v->tag,"text"=>trim($v->plaintext));

    }

    if(!$v->firstChild())

    {

    $Arr[$i][] = array("tag"=>$v->tag,"text"=>trim($v->plaintext));

    }

    }

    }

    }

    /**

    * 解析HTML里面的表情

    * @param $value HTMLDOM

    * **/

    private function AnalysisHtmlDom($value)

    {

    $tmp = array();

    if($value->has_child())

    {

    foreach($value->children as $k=>$v)

    {

    $this->AnalysisHtmlDom($v);

    }

    }

    else

    {

    if($value->tag == "a")

    {

    $tmp = array("tag"=>$value->tag,"href"=>$value->href,"text"=>$value->innertext);

    }

    else if($value->tag == "img")

    {

    $src = $this->unescape($value->src);

    $UrlArr = parse_url($src);

    if(!isset($UrlArr['host']))

    {

    $src = $this->host.$value->src;

    $UrlArr = parse_url($src);

    }

    $src = $this->getImageFromNet($src,$UrlArr); //表示有网络图片,需要

    if($src)

    {

    $imgsArr = $this->GD($src);

    $tmp = array("tag"=>$value->tag,"src"=>$src,"text"=>$value->alt,"width"=>$imgsArr['width'],"height"=>$imgsArr['height']); }

    }

    else

    {

    $tmp = array("tag"=>$value->tag,"text"=>strip_tags($value->innertext));

    }

    $this->LinetextArr[] = $tmp;

    }

    }

    /**

    * 根据GD库来获取图片的如果太多,进行比例压缩

    * **/

    private function GD($src)

    {

    list($width, $height, $type, $attr) = getimagesize($src);

    if($width > 800 || $height > 800 )

    {

    $width = $width/2;

    $height = $height/2;

    }

    return array("width"=>$width,"height"=>$height);

    }

    /**

    * 将Uincode编码转移回原来的字符

    * **/

    public function unescape($str) {

    $str = rawurldecode($str);

    preg_match_all("/(?:%u.{4})|&#x.{4};|&#d+;|.+/U",$str,$r);
    $ar = $r[0];
    foreach($ar as $k=>$v) {
    if(substr($v,0,2) == "%u"){
    $ar[$k] = iconv("UCS-2BE","UTF-8",pack("H4",substr($v,-4)));
    }
    elseif(substr($v,0,3) == "&#x"){
    $ar[$k] = iconv("UCS-2BE","UTF-8",pack("H4",substr($v,3,-1)));
    }
    elseif(substr($v,0,2) == "&#"){
    $ar[$k] = iconv("UCS-2BE","UTF-8",pack("n",substr($v,2,-1)));
    }
    }
    return join("",$ar);
    }
    /**
    * 图片
    * @param $Src 目标资源
    * @param $UrlArr 目标URL对应的数组
    * **/
    private function getImageFromNet($Src,$UrlArr)
    {
    $file = basename($UrlArr['path']);
    $ext = explode('.',$file);
    $this->ImgDir = $this->CurrentDir."/".$UrlArr['host'];
    $_supportedImageTypes = array('jpg', 'jpeg', 'gif', 'png', 'bmp', 'tif', 'tiff');
    if(isset($ext['1']) && in_array($ext['1'],$_supportedImageTypes))
    {
    $file = file_get_contents($Src);
    $this->HttpRequestArr[] = $Src;
    $this->HttpRequestTime++;
    $this->_mkdir(); //创建目录,或者收集错误
    $imgName = md5($UrlArr['path']).".".$ext['1'];
    file_put_contents($this->ImgDir."/".$imgName,$file);
    $this->DownImg++;
    return $UrlArr['host']."/".$imgName;
    }
    return false;
    }
    /**
    * 创建目录
    * **/
    private function _mkdir()
    {
    if(!is_dir($this->ImgDir))
    {
    if(!mkdir($this->ImgDir,"7777"))
    {
    $this->error[] = error_get_last();
    }
    }
    }
    /**
    * 构造WordDom
    * **/
    private function CreateWordDom()
    {
    $PHPWord = new PHPWord();
    $PHPWord->setDefaultFontName('宋体');
    $PHPWord->setDefaultFontSize("11");
    $styleTable = array('borderSize'=>6, 'borderColor'=>'006699', 'cellMargin'=>120);
    // New portrait section
    $section = $PHPWord->createSection();
    $section->addText($this->Details(),array(),array('spacing'=>120));
    //数据进行处理
    foreach($this->LinetextArr as $key=>$lineArr)
    {
    if(isset($lineArr['tag']))
    {
    if($lineArr['tag'] == "li")
    {
    $section->addListItem($lineArr['text'],0,"","",array('spacing'=>120));
    }
    else if($lineArr['tag'] == "img")
    {
    $section->addImage($lineArr['src'],array('width'=>$lineArr['width'], 'height'=>$lineArr['height'], 'align'=>'center'));
    }
    else if($lineArr['tag'] == "p")
    {
    $section->addText($lineArr['text'],array(),array('spacing'=>120));
    }
    }
    else if($key == "table")
    {
    $PHPWord->addTableStyle('myOwnTableStyle', $styleTable);
    $table = $section->addTable("myOwnTableStyle");
    foreach($lineArr as $key=>$tr)
    {
    $table->addRow();
    foreach($tr as $ky=>$td)
    {
    $table->addCell(2000)->addText($td['text']);
    }
    }
    }
    }
    $this->downFile($PHPWord);
    }
    public function Details()
    {
    $msg = "一共请求:{$this->HttpRequestTime}次,共的图片有{$this->DownImg}张,并且完成大约使用时间:{$this->expendTime}秒,整个程序执行大约消耗内存是:{$this->expendmemory}KB,";
    return $msg;
    }
    public function downFile($PHPWord)
    {
    if(empty($this->filename))
    {
    $UrlArr = parse_url($this->url);
    $this->filename = $UrlArr['host'].".docx";
    }
    // Save File
    $objWriter = PHPWord_IOFactory::createWriter($PHPWord, 'Word2007');
    $objWriter->save($this->filename);
    header("Pragma: public");
    header("Expires: 0");
    header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
    header("Cache-Control: public");
    header("Content-Description: File Transfer");
    //Use the switch-generated Content-Type
    header('Content-type: application/msword');//输出的类型
    //Force the download
    $header="Content-Disposition: attachment; filename=".$this->filename.";";
    header($header);
    @readfile($this->filename);
    }
    }上面的代码重点感觉不是word生成,而是Simplehtmldom的使用,这是一个开源的HTML解析器,之前有提到,这几天在看他的代码,
    引出了两个学习方向
    ① 正在表达式
    ② 这个扩展的函数整理
    看源代码的收获:
    PHP的异常是可以捕获的,而且PHP的错误也是可以捕获的。

    html转word保留css

    三个办法:

    (1)截图,插入到word文件中

    (2)用IE打开,另存为,保存类宽绝渗型选择'web档案

    单一文件(*.mht)',保存后,对它点右键,打开方式,选择word打开也可以.

    (3)打开这个word文件后,选择office菜单下面的另存宏肆为菜单

    ,在”另存为“的下拉菜单中选择最下面一个”其慎脊他格式“点击进去之后,在文件格式网页格式,然后再点保存就可以了;

    html2word

    打开这个文档,以桌面上随便一个word为例,就拿今天在军事网上看到闭带的文章为例吧,打这个文件打开;

    打开这个word文件后,选择office菜乎态启单下面的另存为菜单

    ,如图;

    在岁如”另存为“的下拉菜单中选择最下面一个”其他格式“,如图;

    点击进去之后,在文件格式网页格式,然后再点保存就可以了;

    导出为word

    两种方式:

    1、纯Java,用POI来做2、或逗用JNA调用word接口,根据officeapi来做衫灶卖辩培第一种呢对于java开发来说相对简单,但是需要学POI,而且估计有些格式控制不好。

    第二种要学习JNA,而且需要边做变差word的officeapi。

    h5怎么转成word

    有两种方法,一种是选中你要保存的HTML文字,复制,然后扮喊橘打开一个word空白文档,在“编辑”菜单中选择“渗唤选择性粘贴厅团”,选择无格式文本就可以了。第二种是把这个HTML文件保存下来,选中这个文件,右击,选择打开方式,选择WORD打开,再保存为doc格式就可以了。

    以上就是html导出word的全部内容,html的复选框导出到word方法如下:1、在HTML网页中使用复选框标签来创建复选框。2、再在网页中使用JavaScript或其它脚本语言,获取用户勾选的复选框信息,并将其存储到一个变量中。3、。

猜你喜欢