A-A+

fgetcsv读取中文数据不完整的解决方法

2013年05月27日 PHP 暂无评论 阅读 3,523 次

在使用fgetcsv读取文件内容时,在我本地机器上没有问题,但是放到服务器上,有些数据就读取不正常,具体表现为数据不完整。
如果一段文字中夹杂着字母、数字和中文,则字母或数字前的中文无法读取,但字母或数字后的中文却能够保留。
csv
第一种解决办法:
通过谷歌搜索了一下,fgetcsv函数对区域设置是敏感的。加上setlocale即可解決。

注释:setlocale() 函数仅针对当前脚本改变地区信息。

提示:可以通过 setlocale(LC_ALL,NULL) 把地区信息设置为系统默认。

// utf-8
setlocale(LC_ALL, 'en_US.UTF-8');
// 简体
setlocale(LC_ALL, 'zh_CN');
//设置回系统默认
setlocale(LC_ALL,NULL);

以下是常用的地区标识(若在linux下可通过命令"locale -a"查看系统支持哪些标识)

zh_CN GB2312
en_US.UTF-8 UTF-8
zh_TW BIG5
zh_HK BIG5-HKSCS
zh_TW.EUC-TW EUC-TW
zh_TW.UTF-8 UTF-8
zh_HK.UTF-8 UTF-8
zh_CN
zh_CN.gb18030
zh_CN.gbk
zh_CN.utf8
zh_HK
zh_HK.utf8

第二种解决办法:(替代函数, 执行效率低)
php自带的fgetcsv函数对中文支持总出问题,处理中文文档时,经常出现中文字符串丢字或乱码的情况。但找了个替代函数:

function fgetcsv_reg(& $handle, $length = null, $d = ',', $e = '"') {
$d = preg_quote($d);
$e = preg_quote($e);
$_line = "";
$eof=false;
while ($eof != true) {
$_line .= (empty ($length) ? fgets($handle) : fgets($handle, $length));
$itemcnt = preg_match_all('/' . $e . '/', $_line, $dummy);
if ($itemcnt % 2 == 0)
$eof = true;
}
$_csv_line = preg_replace('/(?: |[ ])?$/', $d, trim($_line));
$_csv_pattern = '/(' . $e . '[^' . $e . ']*(?:' . $e . $e . '[^' . $e . ']*)*' . $e . '|[^' . $d . ']*)' . $d . '/';
preg_match_all($_csv_pattern, $_csv_line, $_csv_matches);
$_csv_data = $_csv_matches[1];
for ($_csv_i = 0; $_csv_i < count($_csv_data); $_csv_i++) {
$_csv_data[$_csv_i] = preg_replace('/^' . $e . '(.*)' . $e . '$/s', '$1', $_csv_data[$_csv_i]);
$_csv_data[$_csv_i] = str_replace($e . $e, $e, $_csv_data[$_csv_i]);
}
return empty ($_line) ? false : $_csv_data;
}

给我留言