Регулярное выражение PHP для расшифровки английских и китайских иероглифов


У меня есть описание на английском и китайском языках.

Как бы я использовал регулярное выражение, чтобы сказать что-то вроде: если строка содержит китайский иероглиф, то сделайте A, иначе сделайте B?

Пример здесь

电源: 110V/220W50-60HZ
功率:60W
光源:12V 150 W
尺寸:220x150x280mm
重量:2.3KG



Voltage : 110V/220W50-60HZ
Power : 60W
Bulb : 12V 150 W
Size : 220x150x280mm
Weight:2.3KG
Author: Makoto, 2011-07-30

1 answers

Китайские иероглифы находятся в пределах диапазона: U+4E00..U+9FFF

Если ваше расширение expreg было создано с поддержкой Unicde, b\p{InCJK_Unified_Ideographs} является хорошей заменой [\x{4E00}-\x{9FFF}] (которая была в ссылке, которую дал Йенс Струве).

Вы можете найти большинство (все?) диапазонов Юникода здесь: http://www.regular-expressions.info/unicode.html

Я не уверен, чего вы хотите достичь, но, возможно, хорошим началом было бы разделить ваше описание по строкам. Затем для каждой строки определите, является ли она китайской или нет, и запустите соответствующее регулярное выражение.;)

 4
Author: Savageman, 2012-05-06 17:00:18