第一章(第2节)信息的编码-1
第一章  信息与信息技术
第二节 信息的编码(1)
信息可以用一定的方式表现出来,用来表示信息的符号组合叫做信息的代码。如身份证号码、超市商品条码、电话区号等。
著名科学家冯·诺依曼提出计算机内程序和数据都应采用二进制代码表示。
由于二进制代码中用到的只有“0”和“1”两个符号,从而可以方便地用电脉冲、电位、电路的状态磁化的极性方向来表示,而且信号清晰,不易失真。
所以计算机只能识别和处理“0”、“1”符号串组成的代码,因此使用计算机进行信息处理时,首先要对信息进行编码,把问题转化成二进制代码的计算问题。
l字符编码:
计算机除了要处理数值类型的数据外,还要处理各种非数值类型的数据,如字母、汉字等,所以需要为每个字符规定一个二进制形式的代码。
目前普遍采用ASCII码(American Standard Code for Information Interchange 美国信息交换标准码),后又扩充了128个字符,成为扩展ASCII码。(用Alt+小键盘数字)
例如:“A”的ASCII码为65,也就是1000001B;“a” 的ASCII码为97,也就是1100001B。
  标准ASCII码使用7位二进制数,27=128个代码,由94个图形字符码好34个控制符码组成。
任务一在word中,用Alt+小键盘数字输出ASCII码。
(如:Alt+65为“A”、Alt+137为“”、Alt+169为“©”、 Alt+ 174为“®)
思考为什么7位ASCII码只能表示128个符号,那么8位呢?
ASCII字符编码表
ASCII
字符
控制字符
ASCII
字符
ASCII
字符
ASCII
字符
  000   
 
  NUL 
  032 
空格
  064 
  @
  096 
 ` 
  001 
   
  SOH 
  033 
  !
  065 
  A
  097 
 a 
  002 
   
  STX 
  034 
  "
  066 
  B
  098 
 b 
  003 
   
  ETX 
  035 
  #
  067 
  C
  099 
 c 
  004 
   
  EOT 
  036 
  $
  068 
  D
  100 
 d 
  005 
   
  END 
  037 
  %
  069 
  E
  101 
 e 
  006 
   
  ACK 
  038 
  &
  070 
  F
  102 
 f 
  007 
嘟声
  BEL 
  039   
  '
  071 
  G
  103 
 g 
  008 
   
  BS 
  040 
  (
  072 
  H
  104 
 h 
  009 
   
  HT 
  041 
  )
  073 
  I
  105 
 i 
  010 
换行
  LF 
  042   
  *
  074   
  J
  106   
 j 
  011   
起始
  VT   
  043   
  +
  075   
  K
  107   
 k 
  012   
换页
  FF   
  044   
  ,
  076   
  L
  108   
 l 
  013   
回车
  CR   
  045   
  -
  077   
  M
  109   
 m 
  014   
   
  SO   
  046   
  .
  078   
  N
  110   
 n 
  015   
   
  SI   
  047   
  /
  079   
  O
  111   
 o 
  016   
   
  DLE   
  048   
  0
  080   
  P
  112   
 p 
  017   
   
  DC1   
  049   
  1
  081   
  Q
  113   
 q 
  018   
   
  DC2   
  050   
  2
  082   
  R
  114   
 r 
  019   
   
  DC3   
  051   
  3
  083   
  S
  115   
 s 
  020   
   
  DC4   
  052   
  4
  084   
  T
  116   
 t 
  021   
   
  NAK   
  053   
  5
  085   
  U
  117   
 u 
  022   
   
  SYN   
  054   
  6
  086   
  V
  118   
 v 
  023   
   
  ETB   
  055   
  7
  087   
  W
  119   
 w 
  024   
   
  CAN   
  056   
  8
  088   
  X
  120   
 x 
  025   
   
  EM   
  057   
  9
  089   
  Y
  121   
 y 
  026   
   
  SUB   
  058   
  :
  090   
  Z
  122   
 z 
  027   
   
  ESC   
  059   
  ;
  091   
  [
  123   
 
  028   
   
  FS   
  060   
  <
  092   
 
  124   
 | 
  029   
   
  GS   
  061   
  =
  093   
  ]
  125   
 
  030   
   
  RS   
  062   
  >
  094   
  ^
  126   
 ~ 
  031   
   
  US   
  063   
  ?
  095   
  _
  127   
   
2汉字编码
汉字输入
汉字输入方法有两大类:一类是自动识别方式,包括字形和语音的自动识别;另一类是将汉字编码输入,这种编码称汉字输入码(又称外码)。
汉字输入码通常是利用汉字的音、形或其他特征信息,按照一定的规则,使用字母、数字和
符号来对汉字进行编码,使得我们能利用西文标准键盘来出汉字。有音码、形码、音形码、形音码。
汉字输入法的好坏主要考虑:击键率(简码、双拼)、重码率、方便记忆(易于掌握)。
提高拼音汉字输入速度的方法:①利用简码
②用双拼输入
③用词组输入
交换码
为了方便各数字系统(不仅是计算机系统)之间的汉字信息的通信交换,国家颁布GB2312-80《信息交换用汉字编码及字符集》这种代码又称区位码(区码、位码)。
01  02  03  04  05  06  07  08  09………92  93  94
01      、 。 · ˉ ˇ ¨ 〃 々      ↑ ↓ 〓
……
16 啊 阿 埃 挨 哎 唉 哀 皑 癌…………包 褒 剥
17 薄 雹 保 堡 饱 宝 抱 报 暴…………秉 饼 炳
18 病 并 玻 菠 播 拨 钵 波 博…………颤 昌 猖
19 场 尝 常 长 偿 肠 厂 敞 畅…………滁 除 楚
………..
54  帧 症 郑 证 芝 枝 支 吱 蜘…………贮 铸 筑
55 住 注 祝 驻 抓 爪 拽 专 砖…………
56 亍 丌 兀 丐 廿 卅 丕 亘 丞…………攸 佚 佝
57 佟 佗 伲 伽 佶 佴 侑 侉 侃…………冱 冽 冼
58 凇 冖 冢 冥 讠 讦 讧 讪 讴…………邳 邶 邺
……….
94……..
处理码
处理码是计算机内部用于信息处理的汉字代码,也称为汉字机内码。(把区位码的区、位分别加上160)
GB2312编码(GB2312-1980、GB2312-80)
使用双字节编码(16位),共收录了6763个简体汉字,一级汉字3755(常用字),以拼音顺序排列;二级汉字3008个,以偏旁笔画顺序排列。
(BIG5繁体字编码,使用双字节编码,收录了13053个汉字)
汉字编码GBK编码
GBK全称为汉字内码扩展规范,使用双字节编码,收录了GB 2312 中的全部汉字、非汉字符号及GB 13000.1 中的其他 CJK 汉字,合计20902个汉字。
⑶GB18030编码
GB18030分别以单字节、双字节和四字节进行编码,是我国现时最新的內码字集,与GB 2312-80与GBK兼容。
(4字节编码:把字符集分为128个组,每个组256个平面,每个平面有256行,每行有256个字位,每个字符编码由组号、平面号、行号、字位号组成,汉字为0组0平面,所以4字节中前两个字节都是0)
任务二汉字编码表中能否到自己的名字,并把名字及编码(汉字内码,用十六进制)记在书上第7页右边空白处。
任务三在word中输出汉字“亞”(ya)、“偲”(cai)、“赟”(yun)(利用全拼输入法,采用GBK字符集)
字形码
为了汉字的输出显示和打印,需要描述汉字的字形,有点阵方式和矢量方式,这种对汉字字形的编码称为汉字的字形码。
可以试一试造字程序:
⑴单击“开始”→“所有程序”→“附件”→单击“TrueType 造字程序”
⑵造一个字或符号,保存字符后,再进行输入法链接。
⑶打开“Word”,输入刚才造好的字符。
3掌握UltraEdit工具软件
任务四用UltraEdit工具观察字符的内码
⑴单击“开始”→“所有程序”→“UltraEdit”→单击“UltraEdit”
⑵打开UltraEdit软件后,在编辑窗口内输入:
班级+学号+姓名+a+a+A+A+亞+偲+赟
⑶单击切换成16进制方式。
⑷仔细观察:a、把姓名的内码与任务二的记录结果进行比较
b、半角符号与ASCII字符编码表比较(注意16进制与10进制区别)
c、全角符号与GB2312编码表比较。
⑸试着修改内码观察字符的变化,反过来修改字符后,观察内码的变化。
附录:
GB2312编码表
code  0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F
A1A0      · ˉ ˇ ¨
A1B0 
A1C0  ± × ÷
A1D0 
A1E0  ° ¤ §
A1F0   
A2A0   
A2B0 
A2C0 
A2D0 
A2E0 
A2F0   
A3A0   
A3B0 
A3C0 
A3D0  _
A3E0 
A3F0   
A4A0   
A4B0 
A4C0 
A4D0 
A4E0 
A4F0   
A5A0   
A5B0 
A5C0 
A5D0 
A5E0 
A5F0   
A6A0    Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο
A6B0  Π Ρ Σ Τ Υ Φ Χ Ψ Ω
A6C0  α β γ δ ε ζ η θ ι κ λ μ ν ξ ο
A6D0  π ρ σ τ υ φ χ ψ ω
A6E0  ︿
A6F0   
A7A0    А Б В Г Д Е Ё Ж З И Й К Л М Н
A7B0  О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э
A7C0  Ю Я
A7D0  а б в г д е ё ж з и й к л м н
A7E0  о п р с т у ф х ц ч ш щ ъ ы ь э
A7F0  ю я  
A8A0    ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ
A8B0  ò ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ ń ň

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。