druzuz321103 2016-02-22 09:03 采纳率: 100%
浏览 83
已采纳

PHP导入带有BOM的csv文件UTF8

I'm trying to write PHP script for importing CSV files.

I'm using this code:

<form method="post" enctype="multipart/form-data">
<input type="file" name="f"><br>
<input type="submit" name="submit" value="Submit">
</form>

<?php
$row = 1;
if (($handle = fopen($_FILES['f']['tmp_name'], "r")) !== FALSE) {
    while (($data = fgetcsv($handle, 1000, ",")) !== FALSE) {
            $data = array_map("utf8_encode", $data); //added
        $num = count($data);
        // Row
        $row++;
        for ($c=0; $c < $num; $c++) { 
                // Column      
            echo $data[$c] . "<br />
";
        }
    }
    fclose($handle);
}
?>

Script works, but the problem is with encoding characters. In CSV files content is in latvian language, and it shows latvian characters incorrectly.

Some latvian text example:

Šis ir septītais kāzu fotokonkurss Latvijā, turklāt, pēc iesūtīto fotogrāfiju skaita tas ir arī lielākais visā Baltijā. Šajā fotokonkursā piedalījās 90 autori, kuri iesūtīja kopumā 1106 fotogrāfiju. Fotokonkursa apbalvošanas laikā tiks nominēti labākie Latvijas kāzu fotogrāfi 10 dažādās kategorijās: gatavošanās, ceremonija, emocijas, bērni, portrets, jaunais pāris, detaļas, svinības, izšķirošais mirklis un gaismas spēles.

And that is what I receive from script:

Ðis ir septîtais kâzu fotokonkurss Latvijâ turklât pçc iesûtîto fotogrâfiju skaita tas ir arî lielâkais visâ Baltijâ. Ðajâ fotokonkursâ piedalîjâs 90 autori kuri iesûtîja kopumâ 1106 fotogrâfiju. Fotokonkursa apbalvoðanas laikâ tiks nominçti labâkie Latvijas kâzu fotogrâfi 10 daþâdâs kategorijâs: gatavoðanâs, ceremonija, emocijas, bçrni, portrets, jaunais pâris, detaïas, svinîbas, izðíiroðais mirklis un gaismas spçles.

When I simply do echo 'Some latvian text'; it works fine. So the problem is with csv handler. As far as I know, I need to use UTF8 with BOM. But how can I do this?

  • 写回答

1条回答 默认 最新

  • doushenken2833 2016-02-22 09:24
    关注

    If i got you right mb_convert_encoding might be what you are looking for.

    mb_convert_encoding($data, "UTF-8", "ISO-8859-15");
    

    Not sure about the ISO-Code. Maybe this helps: http://webcheatsheet.com/html/character_sets_list.php

    http://php.net/manual/de/function.mb-convert-encoding.php

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题