python 遍历字符串(含汉字)实例详解

python 遍历字符串(含汉字)实例详解

s = "中国china"
for j in s:
  print j

首先一个，你这个'a'是什么编码？可能不是你所想的gbk

>>> a='中国'
>>> a

这样试试看，如果出来是6个字（word)，说明是utf-8，如果是4个字，说明gbk。

另外，不管是utf-8还是gbk，都不能这样遍历，因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。

接下来是遍历问题。

Linux的shell大都默认是utf-8，所以一个中文字符是三个字，所以要三个三个地读，你可以试下：

>>> a[:3]

出来就是个”中”字

windows的command的默认是cp936，也就是gbk，一个中文字符是两个字，所以两个字两个字地读(a[:2])。

还有另一种遍历的方法，把字符串转换成unicode，这样中文英文都是一个字，就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字，而utf-8和gbk里，英文字母只占一个字。

s = u"中国china"
for j in s:
  print j

输出如下：

中
国
c
h
i
n
a

感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：notice#nhooo.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

基础教程