正则表达式(不包含标点符号):

[x{4e00}-x{9fa5}]

正则表达式(包含中文标点符号):

[x{FF10}-x{FF19}]|[x{3000}-x{303F}]|[x{fe10}-x{fe1f}]|[x{ff00}-x{ffef}]

PHP 代码:

$content="今天!我起了个大早。为什么?因为:我饿了!sdjaflkfdjksla.....!!";
$a=preg_match_all("/[x{4e00}-x{9fa5}]|[x{FF10}-x{FF19}]|[x{3000}-x{303F}]|[x{fe10}-x{fe1f}]|[x{ff00}-x{ffef}]/u",$content,$rs);
var_dump($a);
var_dump($rs);

结果:

int(23)

array(1) { [0]=> array(23) { [0]=> string(3) "今" [1]=> string(3) "天" [2]=> string(3) "!" [3]=> string(3) "我" [4]=> string(3) "起" [5]=> string(3) "了" [6]=> string(3) "个" [7]=> string(3) "大" [8]=> string(3) "早" [9]=> string(3) "。" [10]=> string(3) "为" [11]=> string(3) "什" [12]=> string(3) "么" [13]=> string(3) "?" [14]=> string(3) "因" [15]=> string(3) "为" [16]=> string(3) ":" [17]=> string(3) "我" [18]=> string(3) "饿" [19]=> string(3) "了" [20]=> string(3) "!" [21]=> string(3) "!" [22]=> string(3) "!" } }