2011年4月16日星期六

Blogger备份

与其说是备份,倒不如说是抓取。如果要备份自己的blogger,只需要到设置里“导出博客”即可。但要抓取或者说“备份”别人的blogger,那该怎么办呢?一篇一篇地复制有点麻烦,国内的博客备份软件不支持blogger,用Google Reader订阅也只能看最近的几十篇。

Google了一下,找到一篇文章 10 Ways to Backup & Restore your Blogger Blog,讲了十种备份方法:
1. Blogger Backup Utility
2. BlogBackupr
3. HTTrack Website Copier
4. BlogBackupOnline
5. Official Blogger backup steps
6. Manual way to backup posts & Images
7. Using Blogger Email feature
8. BlogCollector
9. Good-old Copy Paste Method
10. Start thinking, innovating

由于是08年的文章,2、4的网站备份已经不能用了,5、6、7、9、10也不适合,就剩下1、3、8这三个备份软件:
(1)当中的Blogger Backup Utility从08年开始就不更新了,下载下来后,不知什么原因,安装出错;
(8)的BlogCollector从07年开始就没有更新,只能导出PDF或Word格式,对分类等等无法备份。

现在就只剩下(3)了,HTTrack Website Copier 如其名,确切地来说是用来制作网站镜像的。这个软件感觉挺强大的,界面简单,支持代理。

最近想学习blogger的优化技巧,找到一个不错的blogger——Abin's Tech Note,里面有不少文章是讲优化技巧的。一篇篇翻太麻烦了,刚好可以试一下这个HTTrack Website Copier,把整个blogger搬到电脑上慢慢看。

打开软件,添加“新的工程”,并设置GAppProxy代理。本以为一个只有97篇文章的blogger一两个小时就可以全部搞定。哪知道这么一拖就拖了10多个小时之久,整个镜像接近1.2G!天哪!居然有1.2G!!真是不可思议!

打开镜像,跟实际网上浏览没什么差别,所有的都一模一样。虽说不能按分类浏览,但按月份浏览也足够了。不过,这镜像大小着实吓了我一跳。

实测点评:作为免费的网站镜像软件HTTrack Website Copier,功能强大,支持翻墙代理,不失为脱机浏览blogger大量文章的好方法。但用GAppProxy拖一个97篇文章的blogger就要花10小时,实在是太伤了,并且镜像文件也有点大。如果不介意时间和镜像大小,那么用HTTrack Website Copier拖吧,但要留意代理的流量限制。

本文地址:http://blog.charyun.com/2011/04/blogger_16.html
如需转载,请注明出处:来自Wake Me Up