写给大忙人看的工作中的知识:锟斤拷问题

写给大忙人看的工作中的知识:锟斤拷问题乙 嗨 你帮我个忙 今天领导说要我处理这个表格 可我看不懂这是啥玩意 你帮我瞧瞧 甲 哦 这是乱码 乙 为什么会出现乱码呢 甲 说来话可长了 乙 快说 快说 甲 美国人发明电脑时

大家好,我是讯享网,很高兴认识大家。

讯享网

乙:嗨,你帮我个忙,今天领导说要我处理这个表格,可我看不懂这是啥玩意,你帮我瞧瞧。
在这里插入图片描述
讯享网
甲:哦,这是乱码。
乙:为什么会出现乱码呢?
甲:说来话可长了…
乙:快说!快说!
甲:美国人发明电脑时,需要存储字符,所以使用了一个数字一个字符的方法,有128个字符。
乙:太少了。
甲:嗯。确实少。它只有7个比特,当时有个1MB内存大家都来羡慕你。请看表
在这里插入图片描述
乙:好像不够啊…
甲:没错。所以各个国家为了语言要求,有自己的编码形式。我们中国有GBK、GB2312等。
乙:那我们打字需要的制表符之类的呢?
甲:有ASCII扩展。ASCII变成了8比特。

在这里插入图片描述
甲:可是,如果你要给国外的人发一封信呢?
一打开:
😒
在这里插入图片描述

甲:为了统一,Unicode诞生了。
UTF-16
甲:UTF16是一种Unicode,确切地说是早期的Unicode。
甲:2个字节为一个字符,可以有65536个字符。:
乙:真多。
甲:光中日韩文字就占一半。
乙:可不是嘛。中华文化博大精深嘛。
甲:可是Unicode5.0发现不够。
乙:怎么能不够呢?
甲:你不信?看看Unicode表
乙:还真是。
甲:于是!
乙:鱼是?我知道鱼是什么!就是🐟呗!
甲:别抬杠。
甲:有20比特,个字符。
乙:太多了。哎?乱码是怎么来的呢?
甲:别急。现在,系统一般只支持65535个字符的UTF-16,所以遇到UTF-16无法显示的就用0xFFFD来代替。
乙:0xFFFD长什么样?
甲:� 就是这样。
乙:┗|`O′|┛ 哦~~
甲:我们中国系统用的是GBK/GB2312格式,如果发来一个UTF8格式的文件,不转换直接解码会造成乱码。
乙:噢。那锟斤拷是如何产生的呢?
甲:如果有连续两个�,那么UTF-8是这样的:0xEF 0xBF 0xBD

0xEF 0xBF 0xBD
甲:按照GBK方式解码是0xEF 0xBF, 0xBD 0xEF, 0xBF 0xBD,即锟斤拷。
乙:噢。前段时间在朋友圈看到有人发一句奇怪的话:
手持两把锟斤拷 口中疾呼烫烫烫 脚踏千朵屯屯屯 笑看万物锘锘锘
乙:我还以为他脑子有毛病呢。

·····································
·
·
·
· 第二天…
·
·
·
·································
甲:你怎么啦?
乙:锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷…
甲:什么?
乙:我的嘴是UTF-8的,你的耳朵是GBK的,咱俩乱码了…

讯享网 于是。 

乙:不要啊!啊~~~~~~~~

-------------------------------- 完-------------------------------

小讯
上一篇 2025-01-09 16:28
下一篇 2025-03-11 21:03

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/20236.html