CB,F5,CA,C7是16进制的表示,表示为2进制是:11001011,11110101,11001010,11000111,最高位都是1,而50,43表示为2进制是:01010000,01000111,最高位为0,ANSI编码格式中,如果最高位为0,那么这个字节就是西文字符,50,43分别表示P,C,最高位是1,那么连续的两个字节代表一个汉字,所以CB,F5代表缩,CA,C7 代表是。
内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。
文本信息的存储格式主要有以下六种:
1.txt:是纯文本文件,不携带字体、字型、颜色等文字修饰控制格式;
2.doc:使用Microsoft Word创建的格式化文件,用于一般的图文排版;
3.html:用超文本标记语言编写生成的文件格式,用于网页制作;
4.pdf:便携式文档格式,是由Adobe系统公司开发的一种文件格式,主要应用于电子文档、出版等方面;
5.jpg:文件格式是静态图像压缩的国际标准,是应用广泛的图像压缩格式,多用于网络和光盘读物上;
1.纯文本文件也称非文书文件,如计算机源程序文件、原始数据文件等均属于纯文本文件,它注重的是字母符号的内在含义,一般不需要编辑排版。
在文本文件内除回车符外,没有其他不可打印或显示的控制符;
2.带格式文本文件通称文档文件,也称文书文件,例如文章、报告、书信、通知等都属于文档文件。
它注重文字表现形式,成文时需要对字符、段落和页面格式进行编辑排版。