IE:免去脱机浏览中的麻烦

现在大家普遍用微软的IE作为默认的浏览器上网看新闻查资料,IE从5.0开始提供了强大的“另存为”的脱机浏览功能,如何实现脱机浏览和如何在线期间尽可能地下载更多的资料以达到节省网费的技巧,已经有很多的文章介绍了 。但即使你用WEBDUP之类的工具把大部分网站内容“搬”到了本地硬盘里,在脱机浏览的时候如果不做专门的改进,依然会有询问是否要连接入网的提示框麻烦,影响你脱机浏览的效率,本文就来谈谈这个问题:
一、脱机浏览中常见问题分析

1、依然困扰人的拨号连接对话框
我们先看看一般的脱机浏览及工具是怎么工作的,就可以知道脱机浏览为什么依然会有连接提示 。在用IE的“另存为”功能的时候,IE在你指定的文件夹里建立你命名的文件名 .FILES为后缀名的子目录,并一一编号 。它会把网页用到的表格、图片等等都存到这些子目录里,而在你指定的文件夹根目录,反而是没多少实际的东西,只是一个INDEX.HTM及一些指针和索引,让浏览器在正式工作的时候到这些指针指向的地方寻找内容 。
IE在下载资料的时候,是要向网站的服务器发送申请下载要求的,而不同的地址解析、IP,网站服务器赋予的权限是不同的,多数人获得的权限不能下载网站的全部内容 。比如网页上面一些和网站合作的厂商的广告,就不能全部下载,但在本地硬盘文件夹指针里,依然保留这些广告的指向 。所以当你在本地硬盘浏览到涉及这些广告的内容时候,即使你事先选了“脱机工作”,Windows依然会弹出对话框询问你是否连接入网,否则就不能显示广告(指同一页面内的广告条、图片等,不是那些弹出另一个网页的广告窗口) 。此外,象网页上的Flash动画及音频等特效,也经常会在你的本地硬盘加入指针,即使不询问你是否拨号连接,也会询问你“是否启动即需即装”,安装FLASH、意大利文显示支持等组件,真是罗里罗嗦 。
用工具软件抓取整个网站,其实过程和IE差不多,也是要向网站的服务器申请下载要求 。只不过工具软件自动化程度高,不象IE的“另存为”每页都要人为指定目标文件夹,而且可以开多个线程,速度更快而已 。
这样,在本地硬盘中保留的所有未获得下载权限的内容,在脱机浏览的时候都将弹出对话框要求连接以满足该网页中链接指向,所以就老出现拨号连接的提示,如果一页内有几处地方指向未下载的内容,那么IE将从头开始询问,您取消一个后,IE马上启动第二个拨号连接对话框,直到全部的下载要求都被取消为止——再加上一些网页有源代码错误,IE的默认自动检测功能可能会经常提示你网页错误,“是否要纠正?”等,你说这是不是麻烦多多,违背了脱机浏览的本意了?

2、大小不一的窗口带来的麻烦
IE的默认设置是如果遇到点击链接处,就打开另一个网页的那种设置,启动另一个IE窗口,保留当前的窗口 。这样打开的另一个窗口多不是最大化状态的,而且在屏幕上所处的位置也不固定,每次你都要先最大化才方便浏览,也是大大影响了浏览的速度和心情 。更糟糕的是,在IE的IETERNET选项里没有相应的窗口状态内容可供调整 。
那么上述的两大问题如何解决呢?请看:
【IE:免去脱机浏览中的麻烦】
二、相应的解决办法

虽然罪魁祸首是那些广告条、图片等,但最好的办法却不是在下载的时候去掉其指针 。因为IE和绝大部分抓取网站的工具没有为此专门作优化,技术上实现很难 。我们应该把眼光关注在这几点上面:

1、保留拨号连接对话框
当你浏览到涉及那些指向未下载内容的地方时,IE跳出第一个拨号连接对话框,你应该中途停止它,但不要在上面的脱机工作上面点击,这样就等于彻底终止这个进程,IE又将启动第二次拨号连接进程——你要做的是不理会这个对话框,让它留在那里占一个任务条的窗口好了 。保留拨号连接对话框,继续浏览,你会发现其余的内容再也没询问你是否要拨号连接了——因为上一个进程没结束,windows的拨号连接不能同时用一个设置拨号两次 。呵呵,这是个很“旁门左道”的技巧,但很实用 。注意,是忽略保留“拨号连接”的对话框,不是那个“是否保持脱机浏览状态”的小对话框 。

推荐阅读