a263482604 2012-12-05 14:51 采纳率: 0%
浏览 214
已采纳

快速抓取网页数据入库

抓取了网页的html代码保存在一个文本文件里,如何将其table表格里的数据快速定位并入库,高手降临指教!!!
---------------------- 以下就是抓取存在文件里的内容


****




5806系统后台



        <li><a href="">退出登录</a></li>
 </ul>
 </div>

<div id="mainContent">
<div id="sidebar">

</div>
<div id="content">  
    <table width="90%">
        <tr><td></br><h1>订购查询</h1></td></tr>
        <tr><td>    
            <table width="90%" border="0" bordercolor="#FFFFFF" cellspacing="0" cellpadding="0">

                            共分1页显示,当前是
                            1页.
                            <form id='form6' name='form6' method='post' action=''>  <label>跳转到第<select name='pageid' id='pageid'>

1

                    </hr>
                    <tr>
                        <td>名称</td>
                        <td>时间</td>
                        <td>代码</td>
                        <td>代码</td>
                        <td>总数</td>
                        <td>总金额</td>
                        <td>小计</td>
                    </tr>
                    <tr class="trlist">
                    <td>104&nbsp;&nbsp;</td>
                    <td>2012-10-02 00:00:00.0&nbsp;&nbsp;</td>
                    <td>022&nbsp;&nbsp;</td>
                    <td>103&nbsp;&nbsp;</td>
                    <td>1&nbsp;&nbsp;</td>
                    <td>2&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    </tr>
                    <tr class="trlist">
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>&nbsp;&nbsp;</td>
                    <td>2&nbsp;&nbsp;</td>
                    </tr>   
            </table>
</td></tr></table>          
</div>



 


CopyRight 2011-2015




  • 写回答

3条回答 默认 最新

  • jinnianshilongnian 2012-12-05 15:10
    关注

    考虑使用下jsoup吧 类似于css/jquery语法

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 #MATLAB仿真#车辆换道路径规划
  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
  • ¥15 数据可视化Python
  • ¥15 要给毕业设计添加扫码登录的功能!!有偿
  • ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
  • ¥15 微信公众号自制会员卡没有收款渠道啊
  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘