dongyuan1983 2012-11-19 09:47
浏览 33
已采纳

PHP清理“&$”

I'm trying to convert HTML to plain text. I get many &\#8217; &\#8220; etc.

I have tried:

  1. html2text command line
  2. html_entity_decode + ENT_QUOTES | ENT_HTML401 UTF-8
  3. html_entity_decode(htmlentities($str))
  4. strip_tags
  5. trim

It did help a lot for cleaning up other things, but those &\#8217; “ don't get fixed. How can I convert them correctly?

  • 写回答

1条回答 默认 最新

  • dongshenghe1833 2012-11-19 09:51
    关注

    Did you tried "htmlspecialchars_decode"

    <?php
    $str = "<p>this -&gt; &quot;</p>
    ";
    echo htmlspecialchars_decode($str);
    // note that here the quotes aren't converted
    echo htmlspecialchars_decode($str, ENT_NOQUOTES);
    ?>
    

    The above example will output:

    <p>this -> "</p>
    <p>this -> &quot;</p>
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥20 测距传感器数据手册i2c
  • ¥15 RPA正常跑,cmd输入cookies跑不出来
  • ¥15 求帮我调试一下freefem代码
  • ¥15 matlab代码解决,怎么运行
  • ¥15 R语言Rstudio突然无法启动
  • ¥15 关于#matlab#的问题:提取2个图像的变量作为另外一个图像像元的移动量,计算新的位置创建新的图像并提取第二个图像的变量到新的图像
  • ¥15 改算法,照着压缩包里边,参考其他代码封装的格式 写到main函数里
  • ¥15 用windows做服务的同志有吗
  • ¥60 求一个简单的网页(标签-安全|关键词-上传)
  • ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法