| 设计与应用 |
| 驿站大卖场 |
| 驿站课堂 |
| 代客设计 |
| 服务与支持 |
| 留言本 |
第七讲:DSP芯片的基本结构和特征 之 多处理器DSP芯片TMS320C8X |
||||||||||||||||||||||||||||||
| 2.5 多处理器DSP芯片TMS320C8X | ||||||||||||||||||||||||||||||
| TI公司除了生产定点和浮点两类DSP芯片之外,还推出了功能强大的多处理器DSP芯片TMS320C80。该芯片内部集成了5个微处理器,处理速度达到每秒20亿次操作,与外部交换数据的速度为每秒400Mbyte,特别适合于会议电视等多媒体应用。 1.TMS320C80结构 图2.3所示为TMS320C80的内部结构。 图2.3 TMS320C80的内部结构 从图中可以看出,TMS320C80是一个多处理器芯片,它集4个可并行处理的高性能DSP芯片、1个RISC主处理器、1个传输控制器、1个视频控制器和50K字节的SRAM等 |
||||||||||||||||||||||||||||||
| 资源于一体,从而使其处理能力达到每秒20亿次操作(2 BOPS)。该芯片可实时实现新一代的视频压缩和解压缩,可广泛应用于会议电视、可视电话、高速电信、多媒体、图像和视频处理、二维和三维图形加速、虚拟现实、保密、雷达和声纳处理等应用场合。 | ||||||||||||||||||||||||||||||
| 2.并行DSP芯片 TMS320C80上集成了4个高性能的DSP芯片,这4个DSP芯片既可独立运行,也可并行工作。采用64位的指令字,以便于在单个周期内进行多个并行操作。每个处理器具有专用的高速指令缓冲Cache和专用的数据RAM。 每个DSP芯片具有4个主要的功能单元,即1个程序控制器(PFC)、1个数据单元和2个地址单元。PFC处理所有的指令执行,包括程序计数器增量、跳转和中断。3组无开销循环控制器跟踪循环计数和循环的起始及结束地址,而不增加额外的开销。循环控制器在1个公共的循环结束地址内可支持多至3个嵌套的循环。 数据单元可使单周期乘法和算术逻辑单元(ALU)数据通路操作并行执行。32位的ALU可以分解为2个16位ALU或4个8位ALU,以便于对低精度的数据进行更多的并行操作。ALU数据通路内独特的扩展器单元可复制1个1比特值32次、2个1比特值16次或4个8比特数8次以填满1个32位字。这些特征对于减少图像算法中的软件开销很有帮助。 |
||||||||||||||||||||||||||||||
| 3.传输控制器 TMS320C80可以每秒400M字节的速度与外部交换数据,这个性能主要依赖于片内的传输控制器。在这里,传输控制器起智能DMA控制器的作用,进行对片外存储器的访问,使主处理器不增加任何负担。传输控制器可对二维图形进行线性和二维寻址,支持三维图形缓冲。 直接存储器接口提供了对多种存储器的灵活操作,包括DRAM、SDRAM、VRAM和SRAM。此外,优先级任务管理器支持动态的总线宽度,可支持8至64位数据传输。灵活的总线宽度满足了如会议电视等的宽带应用,而不需专用的接口。 |
||||||||||||||||||||||||||||||
| 4.RISC主处理器 RISC主处理器(MP)进行整个芯片的管理并协调与系统内其他处理器的通信。该处理器是一个32位的RISC处理器,内部具有一个 运 算能力为100 MFLOPS 并符合IEEE-754标准的浮点单元(FPU),用以实现高效C语言和作为操作系统的平台。该处理器主要是适应高级语言并协调片内的多处理器资源,可在单周期内完成1个64位数据的访问和1个32位取指。与基本的RISC设计相比,其独特之处在于MP具有完整的浮点指令和一组特殊的矢量浮点指令,这些功能对于图像处理和三维图形来说都是必需的。此外,MP还具有31个32位的寄存器,为整数和浮点操作提供了极大的便利。 |
||||||||||||||||||||||||||||||
| 5.存储器Crossbar结构 TMS320C80的一个重要特征是存储器Crossbar结构。TMS320C80内部有50K字节的SRAM,这些存储器被配置为较小的存储器块以便于通过这个独特的Crossbar开关结构实现多个并行的存储器访问。Crossbar开关还便于片内处理器共享板上RAM。在TMS320C80中,Crossbar在每个时钟周期内可进行5次取指和10次并行数据访问,从而使传输速率达到每秒4.2G字节。硬件控制的优先级机制使得在同一个周期内仅有一个处理器访问一个特定的RAM。存储器Crossbar结构增强了系统的高速并行性能。 |
||||||||||||||||||||||||||||||
| 6.视频控制器 视频控制器具有2个可编程的帧定时器,可按水平或纵向格式同时捕获和显示图像。帧定时器可用于任何捕获/显示的组合中,对不同速率的图像捕获可按异步或同步方式工作。由于帧定时器是软件可编程的,故可用作通用定时器。 在TMS320C80基础上,TI公司还推出了简化型的多处理器芯片TMS320C82,其内部包含2个处理器、44K字节的SRAM,性能为每秒15亿次操作,由于省略了2个处理器和视频控制器,其价格约为TMS320C80的一半。表2.6所示为两者的性能比较。 |
||||||||||||||||||||||||||||||
表2.6 TMS320C80/C82的主要性能比较 |
||||||||||||||||||||||||||||||
|
版主:威特 E-Mail:edadesign@tom.com |