文章分类 | 推荐文章 | 最新文章 | 热点文章 | 最新软件 | 国产软件 | 国外软件 | 汉化补丁 | 设为首页 | 加入收藏
业界资讯 | 图形图像 | 操作系统 | 网络冲浪 | 工具软件 | 办公软件 | 媒体动画 | 精文荟萃 | 认证考试 | 网站建设 | 技术开发 | 专栏
当前位置:abcdown网络学院办公软件Word把Word转为简洁的html的若干种方法
精品广告
推荐TOP10
·彻底恢复受损的Word文档
·WORD快捷键大全
·Word XP打开WPS文档成乱码的解决方法
·简单三步 解除Word文档保护密码
·在Word中使用超链接技巧三则
·Word文档丢失的预防与数据的恢复
·Word中分节符的妙用
·用Word巧妙复制表格(图)
·巧用分节符创建Word 2000页眉页脚
·Word中的数据计算
阅读TOP10
·Word文档损坏,怎么办?
·WORD驾轻就熟
·用好Word中的段落“大纲级别”
·用Excel 2000与Word 2000制作课程表
·Word文档丢失的预防与数据的恢复
·word无法打开文档怎么办 有三种办法
·加背景设阴影 漂亮的Word文本框DIY
·在Word中使用超链接技巧三则
·WORD快捷键大全
·简单三步 解除Word文档保护密码

把Word转为简洁的html的若干种方法

日期:2007年8月9日 作者: 查看:[大字体 中字体 小字体]


word可以直接另存为 htm,但即使是 另存为 html 也会有大量的废代码。以前我一般用 dreamweaver 的 clean up html 来处理,先处理 word 特有标签,然后删除一些 font,b,span 等。进一步,在 editplus 里面用正则进行处理,最后得到我想要的干净的html 代码。当然最完美的办法就是拷贝文字出来,自己用文本编辑器书写htm标签,:)

今天又看到lifehacker这几种word 2 clean htm方法:

1.使用这个HTML Tidy Library Project开源软件来处理。

2.微软官方站点也有个Office 2000 HTML Filter 2.0工具,可以用来处理掉word2000转html时出现的多余代码。

3.使用这个Word HTML Cleaner 在线工具来处理。只能处理word2000以下版本。

4.有人给出了正则表达式(其实,上面的各种软件也都是用正则来解决的)

删除不需要的标签

<[/]?(fontspanxml[ovwxp]:w+)[^>]*?>
- replace any matches with the empty string

删除class,style...等不需要的属性

<([^>]*)(?:classlangstylesizeface[ovwxp]:w+)=(?:'[^']*'""[^""]*""[^>]+)([^>]*)>
- replace any matches with <$1$2>

详细解释在Clean Word HTML using Regular Expressions



上一篇:巧用暴风影音隐藏重要文件

下一篇:QQ无法接收自定义表情解决方法


相关软件: 相关文章:
·300多种中文字体
·三角洲特种部队之刺刀特遣队 V1.00.09升级档破解版及免CD补丁
·三角洲特种部队之黑鹰坠落 属性修改器两款
·Protel.DXP2004+sp2 电路板设计 ISO超级种子 附破解及教程
·字库 Photoshop必需 400多种中文字体1000多种英文
·三角洲特种部队之黑鹰坠落 作弊码
·新东方商务英语初高级 swf 限速1000k,不定期作种
·15种做爱姿势真人示范写真(图)
·Photoshop十余种漂亮照片边框简单制作技巧
·1937特种兵 - 游戏攻略
·被你抛弃的5种宝贵食物
·windows 2003服务器配置VPN实现各种网络环境VSS协同开发
·三角洲特种部队:刺刀特遣队 任务攻略 - 游戏攻略
·忘记Windows XP登入密码的9种解决办法

特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
[打印本页] [关闭窗口] 转载请注明来源:http://www.abcdown.net
首页 | 本站声明 | 下载帮助 | 发布软件 |
中文版权所有:ABC学院 浙ICP备05000717号