平常爱逛一些音乐坛子,遇到好听的音乐必下之而后快,而且有些帖子附有歌词、介绍,当然也不能放过,将其复制存成文本更方便了我们这些爱好者日后的收藏、练唱。不过最近却发现有的坛子里的网页文字不是那么好保存了。
过去见到需要的网页内容,只需点击浏览器的“文件”-》“另存为”命令并选“文本类型”项即可 得到想要的文字,但现在有些坛子似乎并不希望访客那么容易的得到它帖子里的文字内容,虽然浏览时并无任何异常,但当将其存成文本文件时就会发现文件里除了 你想要的文字外还多了许多不相干的乱码文字(见图一),导致我们无法正常查看和编辑这些文件的内容了。这到底是怎么回事呢?
提示
不同的网站会加入不同的干扰文字,但其原理大多是一样的,通常都是通过<SPAN>、<FONT>等HTML语言代码的特殊语法来实现的,读者只要稍微分析一下就能找出它们的共同点及相应的处理方法。
ULTRAEDIT是很强的文本编辑软件且受到许多电脑用户的推崇,但当用它来处理上述操作时需注意先在“高级”-》“设置”-》“常规”框中选中“允许输入低值ASCII码”项(如图五),以在查找替换操作中启用程序的控制字符识别功能。