Blogbus导出日志的XML文件格式分析

From 孙楠的技术讲堂@Blogbus
鉴于大多数人目前是没有办法正常访问Blogbus的,我转帖过来,请作者谅解。
————————————————-

Blogbus有一个很不错的功能“导出日志”,该功能可以将你所有的博客文章导出为XML格式以便备份和编辑。今天我们就来讲一讲导出日志的XML文件格式。

首先我们把自己的博客导出,步骤如下:
1、登录blogbus
2、选择博客->博客设置->导入导出->点这里导出日志
3、保存XML文件

然后我们就可以分析XML文件格式了,用IE,Firefox或Visual Studio将备份文件打开,便可以看到它的结构:

Blogbus的XML导出文件结构简单清晰,易读易维护,设计得不错。但是关于<Comments></Comments>这个标记,真的需要吗?

1、首先不可能是排序用,日志和评论都以时间排序,而时间都已经有了相应的标记
2、如果是要把评论按照每篇日志分开,似乎也没有必要,毕竟每个<Comment></Comment>都在<Log></Log>里面

思来想去,我感觉比较可能的作用是,在批量处理评论的操作中,可以节省时间。操作数可以从评论条数,减少到日志条数。但是从算法来说,都是O(n),真正效果如何,就要实测了。

另外:
1、日志的顺序可能与博客上看到的顺序不同,但是不会影响导入后的结果。这是由XML的特性决定的。
2、有了XML可以批量删除不必要的html标记,比如将>&nbsp ;< 批量替换为><,也可以把搬家时丢失的评论加进去,当然最重要的功能还是存档啦。

Published by

贰壹

忙忙碌碌仍在路上的人,热爱IT,挚爱16。

6 thoughts on “Blogbus导出日志的XML文件格式分析”

  1. 已经成功地把BlogBus的.xml转到了WordPress上!
    用的是Python法,文章、评论、分类、标签都没问题。
    详情请看:http://xland.zobyhost.com/blog/archives/2316

    1. @磷矿石:
      呃,这位同学,我不是Blogbus的用户,然后,就算是,导出的也是自己博客的XML文件,没理由给你的,如果说blogbus关闭了导出功能,你可以试试联系一下客服。

Leave a Reply

Your email address will not be published.

Captcha Code

This site uses Akismet to reduce spam. Learn how your comment data is processed.