druzuz321103 2016-02-22 09:03 采纳率: 100%
浏览 83
已采纳

PHP导入带有BOM的csv文件UTF8

I'm trying to write PHP script for importing CSV files.

I'm using this code:

<form method="post" enctype="multipart/form-data">
<input type="file" name="f"><br>
<input type="submit" name="submit" value="Submit">
</form>

<?php
$row = 1;
if (($handle = fopen($_FILES['f']['tmp_name'], "r")) !== FALSE) {
    while (($data = fgetcsv($handle, 1000, ",")) !== FALSE) {
            $data = array_map("utf8_encode", $data); //added
        $num = count($data);
        // Row
        $row++;
        for ($c=0; $c < $num; $c++) { 
                // Column      
            echo $data[$c] . "<br />
";
        }
    }
    fclose($handle);
}
?>

Script works, but the problem is with encoding characters. In CSV files content is in latvian language, and it shows latvian characters incorrectly.

Some latvian text example:

Šis ir septītais kāzu fotokonkurss Latvijā, turklāt, pēc iesūtīto fotogrāfiju skaita tas ir arī lielākais visā Baltijā. Šajā fotokonkursā piedalījās 90 autori, kuri iesūtīja kopumā 1106 fotogrāfiju. Fotokonkursa apbalvošanas laikā tiks nominēti labākie Latvijas kāzu fotogrāfi 10 dažādās kategorijās: gatavošanās, ceremonija, emocijas, bērni, portrets, jaunais pāris, detaļas, svinības, izšķirošais mirklis un gaismas spēles.

And that is what I receive from script:

Ðis ir septîtais kâzu fotokonkurss Latvijâ turklât pçc iesûtîto fotogrâfiju skaita tas ir arî lielâkais visâ Baltijâ. Ðajâ fotokonkursâ piedalîjâs 90 autori kuri iesûtîja kopumâ 1106 fotogrâfiju. Fotokonkursa apbalvoðanas laikâ tiks nominçti labâkie Latvijas kâzu fotogrâfi 10 daþâdâs kategorijâs: gatavoðanâs, ceremonija, emocijas, bçrni, portrets, jaunais pâris, detaïas, svinîbas, izðíiroðais mirklis un gaismas spçles.

When I simply do echo 'Some latvian text'; it works fine. So the problem is with csv handler. As far as I know, I need to use UTF8 with BOM. But how can I do this?

  • 写回答

1条回答 默认 最新

  • doushenken2833 2016-02-22 09:24
    关注

    If i got you right mb_convert_encoding might be what you are looking for.

    mb_convert_encoding($data, "UTF-8", "ISO-8859-15");
    

    Not sure about the ISO-Code. Maybe this helps: http://webcheatsheet.com/html/character_sets_list.php

    http://php.net/manual/de/function.mb-convert-encoding.php

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥20 基于决策树的数字信号处理,2ask 2psk 2fsk的代码,检查下报错的原因
  • ¥20 python作业求过程
  • ¥15 wincc已组态的变量过多
  • ¥60 如图:直线与椭圆X轴平行,求直线与椭圆任意一点的相切坐标计算公式
  • ¥50 如何用python使用opencv里的cv::cudacodec::VideoWriter函数对视频进行GPU硬编码
  • ¥100 c#solidworks 二次开发 工程图自动标边线法兰 等折弯尺寸怎么标
  • ¥15 halcon DrawRegion 提示错误
  • ¥15 FastAPI Uvicorn启动显示404
  • ¥15 centos7.9脚本,怎么排除特定的访问记录
  • ¥15 关于#Django#的问题:我的静态文件呢?