当前位置: 首页 / 技术干货 / 正文
好程序员Python教程之字符串编码知识小结

2020-02-10

Python教程 Python培训 好程序员

  好程序员Python教程之字符串编码知识小结,提及Python字符串,你会想到什么?是ASCII,还是Unicode?他们之间是如何转换的?字符串编码和字符串有什么区别?接下来好程序员Python教程就给大家分享Python入门教程中有关字符串的知识点。

好程序员

  1、字符和字节

  一个字符不等价于一个字节,字符是人类能够识别的符号,可以有多种表示方法,不同的表示方法会使用不同的字节数。比如字母A-Z都可以用ASCII码表示(占用一个字节),也可以用Unicode表示(占两个字节),还可以用UTF-8表示(占用一个字节)。

  字符编码的作用是将人类可识别的字符转换为机器可识别的字节码以及反向过程。Unicode是真正的字符串,而用ASCII、UTF-8、GBK等字符编码表示的是字节串。

  2、编码和解码

  以Unicode为例,编码(encode)是将Unicode字符串(中的代码点)转换特定字符编码对应的字节串的过程和规则;解码(decode)是将特定字符编码的字节串转换为对应的Unicode字符串(中的代码点)的过程和规则。

  无论是编码还是解码,都需要一个重要因素,就是特定的字符编码。因为一个字符用不同的字符编码进行编码后的字节值以及字节个数大部分情况下是不同的,反之亦然。

  3、Python编码转换

  Python编码类型默认是UTF-8,Python2的默认编码是ASCII,不能识别中文字符,需要显式指定字符编码;Python3的默认编码为Unicode,可以识别中文字符。

  在Python中不同编码的转换都要经过Unicode,不论是UTF-8或者是GBK,整个过程都是先通过编码decode转换为Unicode告诉Unicode当前的编码格式是什么、然后再通过解码encode转换为自己想要实现的编码格式或类型。

  4、常见编码错误原因

  1)Python解释器的默认编码

  2)Python源文件文件编码

  3)Terminal使用的编码

  4)操作系统的语言设置

  作为人工智能时代的最佳编程语言,Python吸引了广泛关注,选择学习Python的人日益增多。尽管Python入门简单,但企业的高要求促使越来越多的人参加培训班系统学习并积累实战经验。

  好程序员Python教程坚持以就业为导向制定课程,由大牛讲师分阶段授课,面对面讲解,注重学员理论知识和实战经验的双重培养,打造的是企业所需、上岗即用的的Python精英人才!

好程序员公众号

  • · 剖析行业发展趋势
  • · 汇聚企业项目源码

好程序员开班动态

More+
  • HTML5大前端 <高端班>

    开班时间:2021-04-12(深圳)

    开班盛况

    开班时间:2021-05-17(北京)

    开班盛况
  • 大数据+人工智能 <高端班>

    开班时间:2021-03-22(杭州)

    开班盛况

    开班时间:2021-04-26(北京)

    开班盛况
  • JavaEE分布式开发 <高端班>

    开班时间:2021-05-10(北京)

    开班盛况

    开班时间:2021-02-22(北京)

    开班盛况
  • Python人工智能+数据分析 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2020-09-21(上海)

    开班盛况
  • 云计算开发 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2019-07-22(北京)

    开班盛况
IT培训IT培训
在线咨询
IT培训IT培训
试听
IT培训IT培训
入学教程
IT培训IT培训
立即报名
IT培训

Copyright 2011-2023 北京千锋互联科技有限公司 .All Right 京ICP备12003911号-5 京公网安备 11010802035720号