Rss & SiteMap

爱心论坛 http://www.zqax.net/bbs/

自强爱心网是由一群热心公益事业的残疾人共同创办的非盈利性公益网站。网站以服务残疾人为宗旨,同时携手广大残疾人及社会各界爱心人士共同打造残疾人的网上家园!
共1 条记录, 每页显示 15 条, 页签: [1]
[浏览完整版]

标题:[转帖]Excel轻松提取网上数据

1楼
丫头 发表于:2007/5/1 22:28:29
搞网上信息采集工作,最头疼的便是从网页上一次次很枯燥地进行数据表格的复制,而且在复制过来之后还要进行很多修改,不但麻烦而且也很浪费时间,工作效率大打折扣。这时我们不妨用功能强大的Excel来试着解决一下问题。

  对于比较规范的表格数据,我们完全可以在表格页面上点击右键,选择"导出到Microsoft Office Excel"(图1),此时系统会自动打开Office Excel,进行数据加载。这个过程仅需要几秒钟就把数据加载进来(图2)。如果你认为数据比较适合你的编辑要求,那么就可以直接保存了。否则,也可以做一下适当的修改,因为在表格处理方面,Excel要大大优于word。

图片点击可在新窗口打开查看图1

  在网上表格或数据采集这一点上,Excel往往是较为智能化的,它在进行数据采集与加载时,只加载表格固定区域内的数据,而不是把整个网页都加载进来。这一点我试过很多次,都是很听话的,请看图片2的效果。

图片点击可在新窗口打开查看图2

  当然,在网页中也有一些不太规范的数据与表格,这样的数据,Excel处理起来,稍稍有一点难度,不过只要熟悉Excel的操作功能的话,还是可以轻松搞定的。先看一下这个页面(图3),

图片点击可在新窗口打开查看图3

  图3这种不规范的页面数据,如果让Excel处理起来就会出现这样的结果(图4),看着是不是感觉很乱,所有的东西都错位了,一般的人会感到速手无策的。主要原因就是多出了文件数据的开头与结尾。

图片点击可在新窗口打开查看图4

  不过,只要我们删除文件上下两头的不规范的区域,剩下的这些数据不就变得好处理了吗?这时,我们再执行一下菜单:"数据――分列――下一步",这样就可以把不规范的数据变得规范了。这是处理之后的结果(图5)

图片点击可在新窗口打开查看图5

  对于那些本来就比较规范的表格,就简单得多了,只要执行"导出加载――略修――保存"就可以了。

本文转载于天极设计在线

共1 条记录, 每页显示 15 条, 页签: [1]

Copyright 2006 - 2022 © 自强爱心网 All Rights Reserved
工业和信息化部ICP/IP信息备案号:辽ICP备 11006191号-1
Powered By Dvbbs Version 8.3.0
Processed in .04688 s, 2 queries.