功能说明:网页文件与TXT文件的转换
一、网页文件转换为TXT纯文本文件(Htm2Txt):
目前的版本,Htm2Txt的主要内部设置在菜单“选项”下面的“Htm2Txt选项”里设置,其他设置在“文本转换器通用选项”。
注意:
“文本转换器通用选项”中的“查看转换后的结果”和“保留程序产生的临时文件”对Htm2Txt无效。
设置说明:
1)“简单快速转换网页文件”:
如果用户的网页文件里面格式比较简单,没有复杂的网页命令、样式表等等,建议使用这个选项,速度较快,但不删除复杂的JAVA语句。
2)尽可能完全转换转换网页为文本:
这个选项是默认选项。
选中这个选项,则转换所有的网页命令,如 转为空格,"转为双引号"“",删除所有的STYLE设置、JAVA语句等。
3)只截取“<pre>”及“</pre>”之间的文本。
很多网页直接使用“<pre>”及“</pre>”来保持文本的原有段落格式,所以选取这个选项可以极方便地得到想要的TXT,而舍弃其他一切。
需要注意的地方:
使用这个选项前需要先对待处理网页文件进行检查。
如果程序发现某个页面中不存在“<pre>”及“</pre>”命令则会自动按选项2)进行完全转换,但只针对该文件这样处理。
网页文件中如果存在很多的“<pre>”及“</pre>”对,程序可能会无法正确转换。
程序不自动判断网页文件的命令是否合乎标准,比如只有“<pre>”而没有成对出现“</pre>”可能导致错误发生。
Htm2Txt在完全转换的过程中会自动处理多数无用的空行(如首尾、中间的大段空行)。
通过在“文本转换器通用选项”选取“两行间自动添加空行”程序会完整地删除所有连续两行的空行,并且每相邻两行之间自动添加一个空行。
二、纯文本文件转换为网页文件(Txt2Htm):
这项功能自动转换TXT文件为网页文件,自动识别EMAIL、网址并转换为网页的链接形式;
每个目录下生成的网页文件之间自动关联--自动形成上下页链接,并生成一个索引文件index.htm。
“完全保留Txt原来的格式”:
如果选中则程序自动使用<pre>和</pre>来保留原来文本的格式。生成的网页在显示时不会自动折行。如果原来的TXT某一行过长会使得网页布局很凌乱。
如果不选此项,则生成的网页文件会自动换行,所以最好原来的TXT减少使用硬回车才会使得网页比较美观。
“TXT文件名作为网页的标题”:
如果选中则程序自动截取.txt的文件名前缀作为网页文件的标题(title),这个选项比较适合于一些文件名已经概括了该TXT文件内容的情况,如:“VB编程技巧第一章.txt”。
默认内置网页模版:
“电子文档处理器”默认提供一个内置模版,同时提供20种不同的电子书配色方案,使用每个配色方案前,用户都可以按“V”钮预览效果。但这个内置模版用户不可以直接改变,“电子文档处理器”在外设的电子书模版提供了相似的模版可供用户修改使用(ebook01.htm)。
支持用户自定义模版:
为了避免或减少用户的二次编辑工作,“电子文档处理器”从1.0.75版本开始支持用户使用自定义模版,详细说明请看帮助文件的“如何建立TXT2HTM的网页模版?”的说明。
注意:
“文本转换器通用选项”中的“查看转换后的结果”和“保留程序产生的临时文件”对Txt2Htm无效。
Txt2Htm支持用户使用自定义网页模版
|