算术编码

更新时间：2024-02-26 08:46:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

实现算术编码及其译码

一、实验内容

借助C++编程来实现对算术编码的编码及其译码算法的实现

二、实验环境

1. 计算机 2. VC++6.0

三、实验目的

1. 进一步熟悉算术编码的原理，及其基本的算法；

2. 通过编译，充分对于算术编码有进一步的了解和掌握；

3. 掌握C++语言编程（尤其是数值的进制转换，数值与字符串之间的转换

等）

四、实验原理

算术编码

算术编码的基本原理是将编码的消息表示成实数0和1之间的一个间隔，消

息越长，编码表示它的间隔就越小，表示这一间隔所需的二进制位就越多。算术编码用到两个基本的参数：符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率，也决定编码过程中信源符号的间隔，而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。给定事件序列的算术编码步骤如下：

（1）编码器在开始时将“当前间隔”设置为[0，1)。（2）对每一事件，编码器按步骤（a）和（b）进行处理（a）编码器将“当前间隔”分为子间隔，每一个事件一个。

（b）一个子间隔的大小与下一个将出现的事件的概率成比例，编码器选择子

间隔对应于下一个确切发生的事件相对应，并使它成为新的“当前间隔”。

（3）最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码。

编码过程

假设信源符号为{A， B， C， D}，这些符号的概率分别为{ 0.1， 0.4， 0.2，0.3 }，根据这些概率可把间隔[0， 1]分成4个子间隔：[0， 0.1]， [0.1， 0.5]，

[0.5， 0.7]， [0.7， 1]，其中[x，y]表示半开放间隔，即包含x不包含y。上面的信息可综合在表03-04-1中。

下表为信源符号，概率和初始编码间隔

符号概率 A 0.1 B 0.4 C 0.2 D 0.3 初始编码间隔 [0， 0.1) [0.1， 0.5) [0.5， 0.7) [0.7， 1]

如果二进制消息序列的输入为：C A D A C D B。编码时首先输入的符号是C，找到它的编码范围是[0.5，0.7]。由于消息中第二个符号A的编码范围是[0， 0.1]，因此它的间隔就取[0.5， 0.7]的第一个十分之一作为新间隔[0.5，0.52]。依此类推，编码第3个符号D时取新间隔为[0.514， 0.52]，编码第4个符号A时，取新间隔为[0.514， 0.5146]，?。消息的编码输出可以是最后一个间隔中的任意数。整个编码过程如图03-04-1所示。

编码和译码的全过程分别表示在下表。

编码过程

步骤 1 2 3 4 5 6 7 8 输入符号 C A D A C D B 编码间隔 [0.5， 0.7] [0.5， 0.52] [0.514，0.52] 编码判决符号的间隔范围[0.5， 0.7] [0.5， 0.7]间隔的第一个1/10 [0.5， 0.52]间隔的最后一个1/10 [0.514，0.5146] [0.514， 0.52]间隔的第一个1/10 [0.5143， 0.51442] [0.514384， 0.51442] [0.5143836， 0.514402] [0.514， 0.5146]间隔的第五个1/10开始，二个1/10 [0.5143， 0.51442]间隔的最后3个1/10 [0.514384，0.51442]间隔的4个1/10，从第1个1/10开始从[0.5143876， 0.514402]中选择一个数作为输出：0.5143876

译码过程

步骤 1 2 3 4 5 6 7 8

间隔译码符号译码判决 0.51439在间隔 [0.5， 0.7) 0.51439在间隔 [0.5， 0.7)的第1个1/10 0.51439在间隔[0.5， 0.52)的第7个1/10 0.51439在间隔[0.514， 0.52]的第1个1/10 0.51439在间隔[0.514， 0.5146]的第5个1/10 0.51439在间隔[0.5143， 0.51442]的第7个1/10 0.51439在间隔[0.51439，0.5143948]的第1个1/10 [0.5， 0.7] C [0.5， 0.52] A [0.514， 0.52] [0.514， 0.5146] [0.5143， 0.51442] D A C [0.514384， D 0.51442] [0.51439， B 0.5143948] 译码的消息：C A D A C D B 五、实验设计：

算术编码是一种无损数据压缩方法，也是一种熵编码的方法。和其它熵编码方法不同的地方在于，其他的熵编码方法通常是把输入的消息分割为符号，然后对每个符号进行编码。而算术编码是直接把整个输入的消息编码为一个数，一个满足(0.0 ≤ n < 1.0)的小数n。所以用两个基本的参数：符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率，也决定编码过程中信源符号的间隔，而这些间隔包含在0到1之间。算术编码的算法思想如下：

（1）对一组信源符号按照符号的概率从大到小排序，将[0,1)设为当前分析区间。按信源符号的概率序列在当前分析区间划分比例间隔。

（2）检索“输入消息序列”，锁定当前消息符号（初次检索的话就是第一个消息符号）。找到当前符号在当前分析区间的比例间隔，将此间隔作为新的当前分析区间。并把当前分析区间的起点（即左端点）指示的数“补加”到编码输出数里。当前消息符号指针后移。

（3）仍然按照信源符号的概率序列在当前分析区间划分比例间隔。然后重复第

二步。直到“输入消息序列”检索完毕为止。（4）最后的编码输出数就是编码好的数据。

六、实验程序：

#include #include\

//定义所需要用到的变量及数组 char S[100], A[10]; float P[10],f[10],gFs; //编码程序

void bianma(int a,int h) {

int i,j; float fr; float ps=1; float Fs=0;

float Sp[100],b[100],F[100];

//以待编码的个数和字符个数为循环周期，将待编码的字符所对应的概率存入到Fs中 for(i=0;i

for(j=0;j

if(S[i]==A[j]) { }

Sp[i]=P[j];

fr=f[j];//将划分好的[0,1)区间的对应点赋值给fr

}

Fs=Fs+ps*fr;//从选择的子区间中继续进行下一轮的分割。不断的进行这个过程，

直到所有符号编码完毕。 ps*=Sp[i]; //求Ps

}

cout<<\//显示最终的算术编码

gFs=Fs;

float l=log(1/ps)/log(2);//计算算术编码的码字长度l if(l>(int)l)l=(int)l+1; else l=int(l);

//将Fs转换成二进制的形式 int d[20];

int m=0; while(l>m) { Fs=2*Fs;

if(Fs>1) { }

else if(Fs<1)d[m]=0; else {d[m]=1;break;}

m++; Fs=Fs-1; d[m]=1;

}

int z=m;//解决有关算术编码的进位问题,给二进制数加1 if(m>=l) { while(1) }

cout<<\

for(int e=0;e

{

d[m-1]=(d[m-1]+1)%2;//最后位加1 if(d[m-1]==1)break; else m--; }

}

//解码程序

void jiema(int a,int h) {

int i,j;

float Ft,Pt;

float Fs=0,Ps=1;

for(i=0;i

for(int j=a-1;j>-1;j--)

{

Ft=Fs; Pt=Ps;

Ft+=Pt*f[j];//对进行逆编码 Pt*=P[j]; }

void main() {

}

if(gFs>=Ft)//对其进行判断，并且将值存入到数组A中 { }

Fs=Ft; Ps=Pt; cout<

}

cout<

cout<<\输入所要编码的符号的个数，并按回车跳转：\int a,i,h=0; cin>>a;

cout<<\请输入符号及其相对应的概率值，并按回车跳转：\for(i=0;i

char x; float y;

cin>>x;

A[i]=x;//将字符依次存入数组A中

cin>>y;

P[i]=y;//将字符所对应的概率依次存入到数组P中

}

for(i=1;i

f[0]=0;

f[i]=f[i-1]+P[i-1];//将要编码的数据映射到一个位于[0,1)的实数区间中

cout<<\请输入所要编码的符号序列，并以*结尾：\ while(1)//这个while语句的作用是将要编码的字符存入到数组S中 { char ss; cin>>ss; if(ss=='*')break;//在以“*”为结尾的时候结束存储 S[h++]=ss; }

}

cout<<\输入的字符经过算术编码之后为：\cout<<\由上述所对应的解码为：\jiema(a,h);

bianma(a,h);

七、实验结果：

八、结果分析

首先根据显示输入所有的字符的个数，以及字符和其概率，经过对“CADACDB”编码之后，我们可以在屏幕上看到最终的编码结果为0.514388，与上式的分析结果相同，进过转换之后产生的二进制代码为10000011101011110。同样也显示了译码结果和输入的相同，即同为“CADACDB”。证明实验编码是可行的。

九、心得体会

这是第二次的信息论实验，借助上周编写的哈夫曼编码的知识和经验，以及在网络上的相关查阅，我也成功的做好了算术编码及其译码的实验，通过这个实验，让我对算术编码有了更进一步的了解，以及对C++的运用，因为我们之前都是使用C语言进行编写程序，对于知识有了新的吸收。受益匪浅啊。

本文来源：https://www.bwwdw.com/article/2xka.html

相关文章：

正在阅读：

算术编码02-26

摩托车灯罩零件的成工艺及塑料模具设计10-14

母亲，我爱您作文500字07-05

打字练习人生哲理文章数篇(一万字)03-08

虎年春联大全_春联大全07-30

茶艺培训资料03-08

4.4 理想溶液和非理想溶液08-19

机械设计制造及其自动化专业简历表格05-06

消防调试 - FC18调试手册V02.002-01

2019年社会工作综合能力（初级）练习题352709-15

上一篇：2017年临床助理医师《综合笔试》模拟试题及答案(6) 下一篇：留学美国其实不想走？侨外职业规划圆你“美国梦”