
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
python编程开发随着互联网的不断发展而被越来越多的程序员掌握,今天我们就通过案例分析来简单了解一下,零基础如何学习python编程开发。
1.代码的编码&注释
1.1编码
1)编码概述
计算机中所有的数据本质上都是以0和1的组合来存储的,编码类似于一个密码本,为文字和0/1的组合提供对应关系。
在文件保存时会根据编码的对应关系找到其对应的0/1写入到硬盘文件中,一般在文件保存时会让用户选择以某种编码保存。
计算机中有很多种编码方式,如gbk和utf-8,每种编码都有自己的一套对应关系,用不同的编码保存文件时,硬盘中存储的0/1组合也是不同的。
保存文件使用某种编码,打开文件就必须使用同样的编码,否则就会乱码。
2)ASCII码
ASCII码只能支持符号、字母、数字。且用8位来表示一个字符。8位表示一个字节(1Byte=8bit)
ASCII码中的开头都是0,是初为了以后扩展而准备的。
ASCII码表中有256个对应关系(0到255)
0表示NULL
ASCII码中的0~9指的是字符串"1"、"2"、..."9"与二进制的对应关系
3)unicode字符集
为了支持其他所有国家的文字,就弄出了万国码unicode
编码和字符集:
ASCII编码,直接是字符和二进制的对照表,此二进制可在计算机中用于内存计算、硬盘存储、网络传输等
unicode字符集,是字符和码位的对应关系,码位本质上也是二进制,此二进制可在计算机中用于内存计算,但一般不会做硬盘存储和网络传输
utf-8编码:是对unicode字符集的码位进行转换处理得到的二进制,此二级制可用于内存计算、硬盘存储、网络传输等
unicode字符集:
现在unicode使用4个字节来表示所有字符,即ucs4
ucs4其实是对ucs2的一个扩展,ucs4默认使用4个字节表示码位,而ucs2用2个字节表示码位
ucs4会在ucs2表示的码位前加0,即:ucs2:0110101101100110变为ucs4:00000000000000000110101101100110
ucs4的优缺点:
缺点:因为都使用4个字节,同样的字符的码位会更占空间;所以在网络传输、硬盘存储时会把unicode字符集的码位转为(压缩)成utf-8等编码的二进制再进行传输和硬盘存储
优点:可以表示所有字符并且长度固定4字节,方便内存中进行数据计算
4)utf-8编码
utf-8编码其实就是对unicode字符集的码位进行压缩加工处理得到的,把二进制码位中不必要的位去掉。
utf-8是为unicode编码设计的一种在存储和传输时节省空间的编码方案,使用1、2、3、4个字节表示所有字符,优先使用1个字符、无法满足则使增加一个字节,多4个字节。
utf-8是一套以8位为一个编码单位的可变长编码,会将一个码位编码为1到4个字节。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请加抖音太原达内IT培训学习了解。