a263482604 2012-12-05 14:51 采纳率: 0%
浏览 214
已采纳

快速抓取网页数据入库

抓取了网页的html代码保存在一个文本文件里,如何将其table表格里的数据快速定位并入库,高手降临指教!!!
---------------------- 以下就是抓取存在文件里的内容


****




5806系统后台



        <li><a href="">退出登录</a></li>
 </ul>
 </div>

<div id="mainContent">
<div id="sidebar">

</div>
<div id="content">  
    <table width="90%">
        <tr><td></br><h1>订购查询</h1></td></tr>
        <tr><td>    
            <table width="90%" border="0" bordercolor="#FFFFFF" cellspacing="0" cellpadding="0">

                            共分1页显示,当前是
                            1页.
                            <form id='form6' name='form6' method='post' action=''>  <label>跳转到第<select name='pageid' id='pageid'>

1

                    </hr>
                    <tr>
                        <td>名称</td>
                        <td>时间</td>
                        <td>代码</td>
                        <td>代码</td>
                        <td>总数</td>
                        <td>总金额</td>
                        <td>小计</td>
                    </tr>
                    <tr class="trlist">
                    <td>104&nbsp;&nbsp;</td>
                    <td>2012-10-02 00:00:00.0&nbsp;&nbsp;</td>
                    <td>022&nbsp;&nbsp;</td>
                    <td>103&nbsp;&nbsp;</td>
                    <td>1&nbsp;&nbsp;</td>
                    <td>2&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    </tr>
                    <tr class="trlist">
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>2&nbsp;&nbsp;</td>
                    </tr>   
            </table>
</td></tr></table>          
</div>



 


CopyRight 2011-2015




  • 写回答

3条回答 默认 最新

  • jinnianshilongnian 2012-12-05 15:10
    关注

    考虑使用下jsoup吧 类似于css/jquery语法

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 运筹学中在线排序的时间在线排序的在线LPT算法
  • ¥30 求一段fortran代码用IVF编译运行的结果
  • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
  • ¥15 lammps拉伸应力应变曲线分析
  • ¥15 C++ 头文件/宏冲突问题解决
  • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
  • ¥50 安卓adb backup备份子用户应用数据失败
  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
  • ¥15 请问Lammps做复合材料拉伸模拟,应力应变曲线问题
  • ¥30 python代码,帮调试,帮帮忙吧