duanmengsuo9302 2017-01-31 11:46
浏览 145
已采纳

正则表达式一次匹配多次出现

I have this string:

<table width="100%">
    <tr>
      <td width="80" valign="top">
        <b>wo  1 februari</b>
      </td>
      <td>
        <table width="100%">
          <tr class="spits-dagdeel spits-Ochtend">
            <td width="60" valign="top">
              <i>Ochtend</i>
            </td>
            <td>
              <p class="spits-2">lichte spits (2)
               </p>
              <p>De eerste dag van de nieuwe maand, woensdag. Tijdens de ochtend is het vaak rustig op de wegen en dat zal ook nu het geval zijn. We verwachten op het drukste moment niet meer dan 150 kilometer file op de snelwegen.</p>
              <p class="spits-klasse"> Bij een lichte spits wordt tot 150 km verwacht. De normale knelpunten hebben files.
  </p>
            </td>
          </tr>
          <tr class="spits-dagdeel spits-Avond">
            <td width="60" valign="top">
              <i>Avond</i>
            </td>
            <td>
              <p class="spits-3">reguliere spits (3)
               </p>
              <p>Deze spits iets meer drukte dan tijdens de ochtendspits, maar dat is vrij gebruikelijk. We verwachten geen bijzonderheden. Alleen bij ongelukken kunnen files snel in lengte toenemen.</p>
              <p class="spits-klasse"> Bij een reguliere spits wordt tot 225 km verwacht. Alle knelpunten hebben files.
  </p>
            </td>
          </tr>
        </table>
      </td>
    </tr>
  </table>

I want to capture data from string this and save it to my database using a regex.

What I'd like for an output is something like this:

array (
    'date' => 'wo 1 februari',
    'partOfDay' => 'Ochtend',
    'intensity' => 'lichte spits (2)',
    'description' => 'De eerste dag van de nieuwe maand, woensdag. Tijdens de ochtend is het vaak rustig op de wegen en dat zal ook nu het geval zijn. We verwachten op het drukste moment niet meer dan 150 kilometer file op de snelwegen.',
    'default' => 'Bij een lichte spits wordt tot 150 km verwacht. De normale knelpunten hebben files.'
);

array (
    'date' => 'wo 1 februari',
    'partOfDay' => 'Avond',
    'intensity' => 'reguliere spits (3)',
    'description' => 'Deze spits iets meer drukte dan tijdens de ochtendspits, maar dat is vrij gebruikelijk. We verwachten geen bijzonderheden. Alleen bij ongelukken kunnen files snel in lengte toenemen.',
    'default' => 'Bij een reguliere spits wordt tot 225 km verwacht. Alle knelpunten hebben files.'
);

Only I have no idea of how to do this in the most efficient way.

  • 写回答

2条回答 默认 最新

  • donglinxi1467 2017-01-31 13:04
    关注

    If you table structure is fixed you can try this:

    $dom = new domDocument();
    $dom->loadHTML($text);//$text is your table
    $dom->preserveWhiteSpace = false;
    $tables = $dom->getElementsByTagName('table');
    $table = $tables->item(1);
    $keys=array('partOfDay','intensity','description','default');
    $arr=array();
    $dt=$tables->item(0);
    $x=0;
    foreach($dt->childNodes as $dates){
        foreach ($dates->childNodes as $k=>$data){
        $date=$data->nodeValue;break;
        }
    
    }
    foreach ($table->childNodes as $key=>$td) {
        $arr[$key]['date']=$date;
        $i=0;
        foreach ($td->childNodes as $k=>$data){
            if($data->hasChildNodes()){
                foreach($data->childNodes as $datum){
                   if(!empty($datum->tagName)){
                 if(strcmp($datum->tagName ,"p")==0 || strcmp($datum->tagName ,"i") == 0 ){
                  $arr[$key][$keys[$i]]=$datum->nodeValue;
                  $i++;
                }
                   }
                }
    
            }
    
    } 
    }
    

    DEMO HERE

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?
  • ¥100 求三轴之间相互配合画圆以及直线的算法
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 自己瞎改改,结果现在又运行不了了