将字符串分隔成数组？

From the given string that is $codes I just want to have all language to language array, all code to code array and finally all family to family array , how can i do this in php? i have tried using dom , but its not possible any otherway would be appreciated, Thanks in advance.

<?php
 $codes = '<pre>
 LANGUAGE      CODE     LANGUAGE FAMILY

AFAR            AA     HAMITIC
ABKHAZIAN       AB     IBERO-CAUCASIAN
AFRIKAANS       AF     GERMANIC
AMHARIC         AM     SEMITIC
ARABIC          AR     SEMITIC
ASSAMESE        AS     INDIAN
AYMARA          AY     AMERINDIAN
AZERBAIJANI     AZ     TURKIC/ALTAIC
BASHKIR         BA     TURKIC/ALTAIC
BYELORUSSIAN    BE     SLAVIC
BULGARIAN       BG     SLAVIC
BIHARI          BH     INDIAN
BISLAMA         BI     [not given]
BENGALI;BANGLA  BN     INDIAN
TIBETAN         BO     ASIAN
BRETON          BR     CELTIC
CATALAN         CA     ROMANCE
CORSICAN        CO     ROMANCE
CZECH           CS     SLAVIC
WELSH           CY     CELTIC
DANISH          DA     GERMANIC
GERMAN          DE     GERMANIC
BHUTANI         DZ     ASIAN
GREEK           EL     LATIN/GREEK
ENGLISH         EN     GERMANIC
ESPERANTO       EO     INTERNATIONAL AUX.
SPANISH         ES     ROMANCE
ESTONIAN        ET     FINNO-UGRIC
BASQUE          EU     BASQUE
PERSIAN (farsi) FA     IRANIAN
FINNISH         FI     FINNO-UGRIC
FIJI            FJ     OCEANIC/INDONESIAN
FAROESE         FO     GERMANIC
FRENCH          FR     ROMANCE
FRISIAN         FY     GERMANIC
IRISH           GA     CELTIC
SCOTS GAELIC    GD     CELTIC
GALICIAN        GL     ROMANCE
GUARANI         GN     AMERINDIAN
GUJARATI        GU     INDIAN
HAUSA           HA     NEGRO-AFRICAN
HEBREW          HE     SEMITIC [*Changed 1989 from original ISO 639:1988, IW] 
HINDI           HI     INDIAN
CROATIAN        HR     SLAVIC
HUNGARIAN       HU     FINNO-UGRIC
ARMENIAN        HY     INDO-EUROPEAN (OTHER)
INTERLINGUA     IA     INTERNATIONAL AUX.
INTERLINGUE     IE     INTERNATIONAL AUX.
INUPIAK         IK     ESKIMO
INDONESIAN      ID     OCEANIC/INDONESIAN [*Changed 1989 from original ISO 639:1988, IN] 
ICELANDIC       IS     GERMANIC
ITALIAN         IT     ROMANCE
INUKTITUT       IU     [        ]
JAPANESE        JA     ASIAN
JAVANESE        JV     OCEANIC/INDONESIAN
GEORGIAN        KA     IBERO-CAUCASIAN
KAZAKH          KK     TURKIC/ALTAIC
GREENLANDIC     KL     ESKIMO
CAMBODIAN       KM     ASIAN
KANNADA         KN     DRAVIDIAN
KOREAN          KO     ASIAN
KASHMIRI        KS     INDIAN
KURDISH         KU     IRANIAN
KIRGHIZ         KY     TURKIC/ALTAIC
LATIN           LA     LATIN/GREEK
LINGALA         LN     NEGRO-AFRICAN
LAOTHIAN        LO     ASIAN
LITHUANIAN      LT     BALTIC
LATVIAN;LETTISH LV     BALTIC
MALAGASY        MG     OCEANIC/INDONESIAN
MAORI           MI     OCEANIC/INDONESIAN
MACEDONIAN      MK     SLAVIC
MALAYALAM       ML     DRAVIDIAN
MONGOLIAN       MN     [not given]
MOLDAVIAN       MO     ROMANCE
MARATHI         MR     INDIAN
MALAY           MS     OCEANIC/INDONESIAN
MALTESE         MT     SEMITIC
BURMESE         MY     ASIAN
NAURU           NA     [not given]
NEPALI          NE     INDIAN
DUTCH           NL     GERMANIC
NORWEGIAN       NO     GERMANIC
OCCITAN         OC     ROMANCE
AFAN (OROMO)    OM     HAMITIC
ORIYA           OR     INDIAN
PUNJABI         PA     INDIAN
POLISH          PL     SLAVIC
PASHTO;PUSHTO   PS     IRANIAN
PORTUGUESE      PT     ROMANCE
QUECHUA         QU     AMERINDIAN
RHAETO-ROMANCE  RM     ROMANCE
KURUNDI         RN     NEGRO-AFRICAN
ROMANIAN        RO     ROMANCE
RUSSIAN         RU     SLAVIC
KINYARWANDA     RW     NEGRO-AFRICAN
SANSKRIT        SA     INDIAN
SINDHI          SD     INDIAN
SANGHO          SG     NEGRO-AFRICAN
SERBO-CROATIAN  SH     SLAVIC
SINGHALESE      SI     INDIAN
SLOVAK          SK     SLAVIC
SLOVENIAN       SL     SLAVIC
SAMOAN          SM     OCEANIC/INDONESIAN
SHONA           SN     NEGRO-AFRICAN
SOMALI          SO     HAMITIC
ALBANIAN        SQ     INDO-EUROPEAN (OTHER)
SERBIAN         SR     SLAVIC
SISWATI         SS     NEGRO-AFRICAN
SESOTHO         ST     NEGRO-AFRICAN
SUNDANESE       SU     OCEANIC/INDONESIAN
SWEDISH         SV     GERMANIC
SWAHILI         SW     NEGRO-AFRICAN
TAMIL           TA     DRAVIDIAN
TELUGU          TE     DRAVIDIAN
TAJIK           TG     IRANIAN
THAI            TH     ASIAN
TIGRINYA        TI     SEMITIC
TURKMEN         TK     TURKIC/ALTAIC
TAGALOG         TL     OCEANIC/INDONESIAN
SETSWANA        TN     NEGRO-AFRICAN
TONGA           TO     OCEANIC/INDONESIAN
TURKISH         TR     TURKIC/ALTAIC
TSONGA          TS     NEGRO-AFRICAN
TATAR           TT     TURKIC/ALTAIC
TWI             TW     NEGRO-AFRICAN
UIGUR           UG     [       ]
UKRAINIAN       UK     SLAVIC
URDU            UR     INDIAN
UZBEK           UZ     TURKIC/ALTAIC
VIETNAMESE      VI     ASIAN
VOLAPUK         VO     INTERNATIONAL AUX.
WOLOF           WO     NEGRO-AFRICAN
XHOSA           XH     NEGRO-AFRICAN
YIDDISH         YI     GERMANIC [*Changed 1989 from original ISO 639:1988, JI] 
YORUBA          YO     NEGRO-AFRICAN
ZHUANG          ZA     [       ]
CHINESE         ZH     ASIAN
ZULU            ZU     NEGRO-AFRICAN
</pre>';

$doc=   new DOMDocument();
$doc->loadHTML($codes);

$xmlL = simplexml_import_dom($doc);
$pathL = $xmlL->xpath('//pre');
print_r($pathL);

?>

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dongxing6802 2012-03-09 09:35
关注
the list is obviously generated, so you'd have better luck fixing the generator, but if you're stuck with this one list, the below should parse it the way you want:

$langs_ar = array(); $codes_ar = array(); $families_ar = array(); foreach(preg_split('/[ ]+/', $codes) as $line) { if (preg_match('/^(\S+\s*\S+)\s+(\S{2})\s+(\S.*\S)\s*$/', $line, $matches)) { $langs_ar[] = $matches[1]; $codes_ar[] = $matches[2]; $families_ar[] = $matches[3]; } }

Oh, and instead of 3 arrays, I'd recommend one array storing hashes for the 3 fields instead; that or make your own objects with the 3 properties lang, code, and family.

Edit: a much shorter way to do the same is this:

preg_match_all('/^(\S+\s*\S+)\s+(\S{2})\s+(\S.*\S)\s*$/m', $codes, $matches, PREG_SET_ORDER); var_dump($matches);

$matches is now an array of "objects" for all your lines where indexes:

0 is the full line

1 is the language

2 is the code

3 is the family

just iterate over that to do whatever you want.
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

请问大佬们在javascript里面如何将"[1,2,3,4,5,6]"这样的字符串转换成数组? css html5 javascript
2021-03-16 16:53

回答 3 已采纳 JSON.parse("[1,2,3,4,5,6]")
如何在Golang中将字符串转换为数组？
2017-03-25 09:12

回答 1 已采纳 To initialize a string slice in Go, you use s := []string{"This is a string"}. To initialize a str
Java 字符串解析成数组 java
2022-07-20 10:23

回答 1 已采纳 String data = "[[-1,-2,-3],[-2,-3,-4],[-4,-5,-6]]"; List<List<Integer>> doubleLevelList
PHP中怎么把字符串分割成数组？
2021-08-08 14:28

80大叔学Java的博客经常会遇到要把字符串分割成数组的情况，在Java中只要调用split(",")方法就能把字符串分割成数组，在JS中也很简单同样也是调用split( "," )方法就可以做到。在php中调用什么方法分割字符串呢？调用explode()方法 ...
在velocity模板引擎中如何将json字符串转化为对象？ html5 有问必答
2021-07-22 18:18

回答 1 已采纳转换成JSONArray形式或 JSONObject 格式在进行遍历或者自定义模板解析方法，专门用来解析 JSON字符串请采纳
由用户输入一行字符串，以逗号为分隔符将字符串分隔后存入数组中，并输出。 html php 有问必答
2022-03-27 10:53

回答 3 已采纳 1 设置同name表格，就可以保存为数组。如： <input type=text name=s value=1> <input type=text name=s value=2&gt
如何把字符串拼接成数组
2017-11-21 07:47

回答 7 已采纳 ``` $str = " 保单号：66404080220170004191 投保人：商正浩
php怎么把字符串转换成数组？
2021-08-24 18:18

低吟~浅唱的博客 2、以"|"为分隔符，将字符串打散为数组，示例： $arr = explode('|',$str); 3、使用print_r，将字符串转换之后的数组打印出来，示例： print_r($arr); 5、explode()函数还有第三个参数，可以限定数组元素的...
怎么使用js把下面字符串转换成数组 ,以 ↵ 为分隔，或者用什么方法,以 ↵ 为节点换行 css3 html5 javascript
2020-09-04 18:02

回答 1 已采纳 var str = “趁着夜色和爱你渐浓↵在落日跟暮色当中↵我在等风也在等你↵我的脚步慢一点↵你的脚步快一…你是不是喜欢我啊，↵你是我心里落日弥漫的橘↵天边透亮最可爱的小星星↵我爱了整个宇宙，只为跟
可以用一维指针进行交换字符串的操作吗？
2018-11-27 05:43

回答 2 已采纳 C语言中实参形参变量之间的数据传递是单向的“值传递”，不可能通过执行调用函数来改变实参指针变量的值，但是可以改变实参变量所指变量的值。你可以使用二级指针做参数来交换
javascript如何获取字符串里的值？ javascript
2019-05-07 14:38

回答 3 已采纳 var str='a=10,b=5,c=5' let arr = str.split(',').map(function (val) { return val.split('=')
php 数组格式的字符串转为数组_php怎么将字符串转换成数组？
2021-01-17 15:22

Agnes 陳老師的博客在php中，可以使用内置函数explode()来将字符串转换成数组；该函数可以将一个字符串根据分隔符拆分为若干个子串，然后将这些子串组合成数组并返回，语法格式为“explode(分隔符,...explode() 函数可以基于字符串分隔...
在 PHP 中如何将字符串转换为数字？ php
2011-12-16 04:08

回答 27 已采纳 You don't typically need to do this, since PHP will coerce the type for you in most circumstances.
把一个字符串分割成数组 php_PHP怎么将字符串拆分成数组
2021-03-22 23:14

weixin_39739404的博客在日常项目开发过程中，较长的字符串...那么将字符串拆分成数组，也很容易实现，我们可以直接通过PHP中的explode函数来进行拆分。下面我们就通过简单的示例，给大家介绍PHP字符串拆分成数组的方法。代码实例如下：...
php把字符串变为数组_php怎么把字符串转换成数组？
2021-03-22 23:49

晓晓孙晓的博客 PHP中，将一个字符串转成数组，是使用非常频繁的一个操作，通常也被叫做将字符串打散为数组，可以使用其内置函数explode()。explode()函数把字符串打散为数组。注释："separator" 参数不能是一个空字符串。注释：该...
没有解决我的问题, 去提问

悬赏问题

¥15 镍氢电池充电器设计实物使用原理
¥15 逻辑谓词和消解原理的运用
¥15 三菱伺服电机按启动按钮有使能但不动作
¥15 js，页面2返回页面1时定位进入的设备
¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号

将字符串分隔成数组？

2条回答 默认 最新

悬赏问题

2条回答默认最新