Board logo

标题: 中国什么时候也有这么牛逼的移动处理器了? [打印本页]

作者: jun4rui    时间: 2012-1-17 22:08     标题: 中国什么时候也有这么牛逼的移动处理器了?



深圳中微电科技有限公司(ICUBE)业务拓展副总裁曹安生最近对国际电子商情表示:“中国第一颗采用和谐统调处理器技术的高效通用处理器IC1将在七月初出样片,预计今年底就可进入到量产阶段。这颗SoC创下了三个中国第一:中国第一颗具有自己指令集架构的双核处理器,中国第一颗真正将CPU和GPU集成在单个Die上的SoC,中国第一颗基于并行计算且具有先进同步多线程设计的多核处理器芯片。”
IC1 具有2个MVP内核,采用65nm工艺制造,最大时钟频率为600MHz,最大工作功耗小于1瓦,支持OpenGL ES2.0和OpenGL,支持高清720p的所有解码格式,支持5.1声道音频,处理能力达到5160DMIPS,峰值性能相当于4.8GHz单核串行处理器。

曹安生指出:“IC1的GPU性能相当先进,每秒可生成最高7千万个三角形,每秒可填充6亿像素,这一性能已非常接近nVidia GPU。另一方面,IC1的die尺寸只有27平方毫米,而nVidia的Tegra 2需要50平方毫米,苹果A5处理器需要122平方毫米。”

IC1基于ICUBE创新开发的MVP(多线程虚拟流水线)内核,MVP具有以下8大特色:第一,基于并行计算的、已整合了指令集架构的处理器核心;第二,600MHz最高时钟频率,65nm工艺,4个线程;第三,超标量的指令执行流水线提供稳定的高性能:3.6GFLOPS或2580DMIPS;第四,可达8个动态线程的内核,具有硬件负载均衡,以及软件可配置的同时多线程技术;第五,支持数据并行、任务并行和功能并行的计算模式,并且减少中断需求和内容切换;第六,核心内存含64KB指令缓存、64KB数据缓存、64KB SRAM、8通道DMA及16中断源控制器;第七,包括内存在内的内核面积仅为3平方毫米,功耗更低至300mw;第八,通过本地编译及MVP驱动程序,同时支持同质和异质的并行计算API接口。

和谐统调对业界的意义

和谐统调处理器技术标志着全球半导体工业的一个里程碑,因为它创新地在一个统一的die上集成了两个不同类型的处理器:中央处理器CPU和图形处理器GPU。这一技术由多线程虚拟流水线并行计算内核、一个独立指令集架构、一个优化编译器和快速交换动态负载平衡器组成。预计它将在今年底把最具成本效益和能效的处理性能带进基于Android的平板移动计算和移动通信市场。

今天市场上的处理器都基于几十年前的设计,这限制了它们利用最新的半导体技术。和谐统调处理器技术凭借其在每个内核上处理高达4个线程(任务)的能力为处理器的性能设立了一个新的行业标准。与今天市场上一个内核只能处理一个线程的处理技术相比,这是一个巨大的突破。这一额外的并行性将给移动计算带来巨大的性能提升,它为平板电脑制造商带来了一个期待已久的解决方案,因为它可极大地提升用户的使用体验。

ICube CTO Simon Moy总结道:“从头开始开发自己的IP是ICube与其它中国技术公司的一个关键差异化点,这为我们提供了一个更大的创新发挥空间,与其它芯片公司相比,这使得我们能够利用最新的半导体技术和降低我们SoC产品的成本。我们很骄傲地吸引和建立起了一支世界一流的开发队伍,其中包括曾参与PowerPC开发的硅谷系统架构师和中国本地才俊。”

曹安生表示,我们现已可为客户提供IC1的开发平台QEMV,明年Q3我们还计划推出4核通用处理器。




有业内来科普一下吗?
作者: waller    时间: 2012-1-17 22:59

posted by wap, platform: SAMSUNG (Galaxy Note)

连cpu都河蟹了。
作者: mirokuneal    时间: 2012-1-17 23:50

posted by wap, platform: SAMSUNG

什么叫自主指令集架构?
作者: leedsun    时间: 2012-1-18 00:34

posted by wap, platform: Android

打磨的货?
作者: d2loader    时间: 2012-1-18 01:21

自主指令集架构。。。等着吃屎吧
作者: 卖哥    时间: 2012-1-18 01:26

居然是AMD路线图2017年上的真Fusion……农企泪流满面……
作者: 卖哥    时间: 2012-1-18 01:38

我大致看了下说明作下猜测

应该是FMT的多线程设计,采用这个技术的著名芯片是Sun的Niagara。
简单的说,就是把一个600mhz处理器变成四个150mhz的处理器,4个线程的轮替切换,隐藏了计算器延迟,保证这4个线程都能吃足150mhz的运行速度而不需要等待。
然后处理器就可以设计的非常简单,处理器小到可以匹敌GPU的运算密度。
问题是这种设计的单线程性能……
作者: 脆骨    时间: 2012-1-18 02:08

posted by wap

单核150mhz
作者: 卖哥    时间: 2012-1-18 02:38

去官网看了下说明……
http://icubecorp.com/zh/products/

居然写明是SMT(同步多线程)而不是FMT(Fine-Grained MultiThreading,交错多线程)
那就有点碉爆了……

然后我去找到了首席架构师申请的一篇名为《多线程处理器及其多线程处理方法》的专利,先上传了。
http://115.com/file/dpycr9na#

具体分析的话,等明天或者其他人吧……
我初略一看大约就是标准的双线程SMT上加了个特殊的地方,那就是,两个线程跑的指令集是可以不同的,例子举的是一个CPU线程和一个DSP线程。
然后除了寄存器操作和内存操作外,还支持sram操作,这里有点像Nv的GPU里面的LS。

[ 本帖最后由 卖哥 于 2012-1-18 03:03 编辑 ]
作者: xiejia31    时间: 2012-1-18 03:52

对于嵌入系统150Mhz够用了。省电才是关键。
作者: leica    时间: 2012-1-18 05:12

posted by wap, platform: iOS

这玩意是为了那台9999的平板做的铺垫么。。。
作者: loveCK    时间: 2012-1-18 05:26

支持一下!
作者: dboy99    时间: 2012-1-18 08:30

看起来还是比较务实的,希望能做出来


问: 人们为什么需要另一个处理器?
答:人们并不需要另一个处理器。他们需要的是更便宜、更高性能和低功耗的电子设备。此外,中国需要一个为她庞大的市场量身定做的、并且更优秀的处理器核心技术。
作为一个在中国境内注册的半导体企业,我们不会像其它国内企业一样,只会采用国外公司拥有的内核技术(如ARM、MIPS) 去开发最终产品。如果采用国外公司的内核技术,只会为国外企业开拓更大的市场,讓他們获取更多的利益。
我们拥有自主研发的处理器核心技术 – MVP,它不但能够满足客户特殊的需求,还可以提供最好的性价比。更重要的是,对使用所有新开发的处理器核心所面临的共同问题 -专用软件应用和开发问题,随着更多的基于ANDROID开源软件和应用程序在国内被广泛采用也得到很好的解决。
为此,我们决定用全新的工业标准结构去设计新的处理器MVP,而这个处理器会带来以下的优点:
    节省成本: 不需要支付昂贵的专利费。
    灵活: 不需要受制于旧的工业标准结构,可以因需要而灵活改变功能和性能。
    自由: 可广泛满足于多应用领域的计算需求。
    优化: 通过优化的半导体工艺来提升处理器的表现。.

问: 为什么多线程处理器(MVP) 比现有的处理器好?
答: MVP 比现有的处理器更具成本效益,更可以如摩尔定律所预计的那样提高处理器的表现,以满足不断出现的应用需求。 例如:并行计算令MVP有更高效率,而它的基本设计和结构会更适合现在和将来的并行计算程序。未来,处理器性价比对于新兴电子产品的重要性将更为显着。

问: ICube的 产品是什么?
答:我们的产品是一个基于并行计算结构、采用自主研发的处理器核心技术(MVP),使用Android操作系统的SoC产品,它带有优化的编译器、并行应用程序接口,以及帮助应用程序移植的配套工具。

问: 如果我现在使用其它处理器的芯片,我能不能够很容易把它转换到MVP 系统的SoC解决方案上?
答:不能够。虽然SoC解决方案不能够简单把芯片更换后便可以马上工作,但是只要面板的系统功能与我们参考板所界定的系统功能相类似,就不需要很多的工作,便可以将面板上的芯片更换。例如:我们提供的参考板是以ANDROID为操作系统,如果要替换的面板,也是采用Android操作系统的,这样就很容易将面板上的芯片替换成我们的SoC芯片。

问: 如果我现在已经有了一个在其它处理器上运行的,用C/C++编写的应用程序,是否很容易移植到MVP上?如果用其它汇编语言编写的程序,如何移植到MVP上?
答:只需要用我们提供的MVP编译器,重新对用C/C++编写的应用程序进行编译,就可以完成在MVP上的移植工作。而用其它汇编语言编写的应用软件程序,必须采用MVP的汇编语言,重新编译。我们会提供相应的文档和工具,来帮助你的移植工作。

问: 为什么要用并行计算呢?
答:随着大量先进应用程序和电子新产品的涌现,它们对处理器的要求日益提高。通过提高时钟频率来加快运算速度,不但会增加耗电量,而且也会遇到生产工艺的瓶颈,所以它并不是一个最佳方法。而多核和多线程的芯片因其可以更有效地提供均衡性能,将肯定被广泛使用。多核和多线程就是并行计算。

问: 现今市场上并没有提供很多的并行应用软件程序,人们如何才能够获得MVP并行处理能力的好处呢?
答:把MVP看成是一个多核处理器。一个多任务的操作系统,可以把MVP当作同步多核处理器,同时运行多个程序而无需对应用程序作改变。

问: 为什么要用Android操作系统?
答:因为开放。Android是基于Linux的一个开放源代码的操作系统,鼓励第三方自由开发应用程序。在Android操作系统上已经有许多优秀和可靠的应用程序,在我们提供产品时,会将它们捆绑在Android操作系统上。对于新的应用,只要用JAVA语言编写应用程序,就可以在ANDROID操作系统上运行了,非常灵活方便。

问: 如果我已用ASIC芯片去处理某一特定功能的话,可以用MVP的SoC解决方案替代吗?
答:很可惜,不可以。虽然MVP 是一个非常有成本效益的通用处理器,但是它不能比带有特定功能的ASIC芯片更有效。MVP更适合处理多个应用程序或需要灵活的可编程系统。

问: 运行时钟频率600MHz的四线程MVP 处理器,与运行时钟频率2.4GHz的单核、单线程处理器的性能是否一 样 ?
答:视情况而定。如果四线程MVP处理器核心要运算4个任务,整体的输出是与四倍运行时钟频率的单核、单线程处理器是相同的。如果该单项任务需要 2.4 GHz的性能去处理的话,相信四线程MVP处理器便不能符合该任务的要求。不过,如果该单项任务如许多应用程序一样,有足够的并行性,它便可以并行地充分利用四线程处理器核心的计算资源去处理,在这种情况下 ,两个处理器的性能是相同的。不过这样的并行应用程序,需要按照一些标准定义的并行应用程序接口重新编译。

问: 如果我需要一个要同时处理4个600 MHz任务的处理器,在 MVP与2.4 GMz串行处理器的操作上有什么区别?
答:操作能力上是无异,但是 MVP则有额外优势,尤其是在切换任务和数据切换方面。当一个较高运行时钟频率的串行处理器处理多项任务时,由于没有重复的处理资源(比如各种缓存),该资源就要被多任务分享,当处理器需要转换新的操作任务时,首先需要把正在处理的计算情况保存好,再处理新的任务;若处理器需要转换回处理旧的操作任务时,首先要把先前保存的处理情况重新装入。这种切换通常导致处理周期功能及能量的消耗。
而MVP的处理器,不同的任务都由不同的线程处理,而不同的线程都独占享有处理资源(各种缓存)。此外,任何空余的的计算资源,将会自动地分配到另一个任务,让所有的资源得到最高的使用,以达到更高的使用率、输出量和效率。所以MVP更有效率。
作者: survivorcn    时间: 2012-1-18 08:39

posted by wap, platform: Nokia (E66)

客户只有中宣部吧
作者: dboy99    时间: 2012-1-18 09:21

搜了一下,发现这家公司还是有料的啊,两个创始人都出身于SGI,一个在nVIDIA呆了7年,技术负责人,搞GPU设计;另一个Fred Chow,SGI和MIPS编译器的首席科学家,搞出了第一个支持AMD Opteron x64的PathScale编译器。

[ 本帖最后由 dboy99 于 2012-1-18 09:24 编辑 ]
作者: 麦克罗索夫    时间: 2012-1-18 09:33

这个无论看不看好,我还是表示支持

那些冷嘲热讽的就算了吧

现在全地球的cpu技术都在美国手里,这样垄断下去对消费者并不好。。。。。。
作者: dboy99    时间: 2012-1-18 09:39

转一篇相关的博文
http://blog.sina.com.cn/s/blog_53d5f2e30100k1eb.html

总公司应该是在香港注册的吧,Catherine貌似不错:D

作者: 喜欢它likeit    时间: 2012-1-18 09:43

安卓,软件需要重编译……

这种东西,装备到国内的山寨猴……

细想,甚怖……
作者: zhangu2    时间: 2012-1-18 10:09

自主指令集。。。
这才叫真正的自主知识产权。。。
就看市场推广程度了,
如果山寨猴都用的话。。。
不敢想了。。。
作者: beterhans    时间: 2012-1-18 10:14

听名字就知道不是好东西
作者: catxing    时间: 2012-1-18 11:03

引用:
原帖由 dboy99 于 2012-1-18 09:21 发表
搜了一下,发现这家公司还是有料的啊,两个创始人都出身于SGI,一个在nVIDIA呆了7年,技术负责人,搞GPU设计;另一个Fred Chow,SGI和MIPS编译器的首席科学家,搞出了第一个支持AMD Opteron x64的PathScale编译器。
如果是这样的话,可信度突然高了几个数量级

技术领导
梅思行:首席技术官
在半导体行业具有30多年工作经验,擅长于微处理器和图型处理器架构的研发和设计。于1997至2004的7年间,作为目前世界顶级图形处理器供应商 nVIDIA 的主架构师之一,直接参与了数代NVIDIA图形处理器芯片中的流处理器架构和硬件设计 ,包括第一代 GeForce, 第一代 Xbox芯片,以及 G80处理器 。在此之前,也曾于多家美国公司 SGI, IBM, LSI Logic 担任多个不同类型微处理器项目的主要工程师。拥有30多个美国专利;其中包括:第一个图形处理器( GPU); 第一个可编程GPU及第一个通用 GPU (GPGPU) 。此三个“第一”在行业中具有更新换代里程碑的重要意义。Simon持有美国伊利诺州大学香槟分校(Urbana-Champaign) 计算机工程学士和硕士学位。2006年回到中国并出任一家芯片设计公司的首席技术官及合伙人。
Fred Chow: 首席科学家兼副总裁
世界著名编译器专家, 是被编译界普遍采用的Open64编译器的首席架构师, 在编译器和系统软件行业具有30年以上的工作及研发经验,并享有极高的学术声誉。曾任MIPS主要工程师,SGI (Silicon Graphics, Inc.) 首席科学家, PathScale 编译器工程部董事负责人。拥有8个美国专利,发表过20多篇学术性文章。持有多伦多大学计算机 科学学士学位,美国史坦福大学计算机工程学硕士及博士学位,是现任史坦福大学校长John Hennessy博士的得意门生

[ 本帖最后由 catxing 于 2012-1-18 11:07 编辑 ]
作者: dboy99    时间: 2012-1-18 11:36

两个牛人都是华人,不难理解
作者: 卖哥    时间: 2012-1-18 16:07

我看了下这个公司首席技术官的专利
让我想起一个东西
Alpha 21464,也就是EV8

那是一个多核处理器蒙昧时代的设计
当时的人们还不是特别清楚如何设计多核处理器

多核处理器是什么样子的呢?
蒙昧时期有两个方向,一个是在一个芯片上简单复制两个核心实现片上的SMP,这条概念实现是IBM的Power4,以及现在几乎所有的多核芯片。
另一个方向,就是制造一个发射宽度为一般处理器两倍的超标量核心,然后在上面跑两个线程,这个概念就是DEC的EV8,然后没有做出来DEC就死掉了,而其团队成员将这份资源带到了AMD,其相关的专利早在K8问世之前就已经注册完毕了,距今超过10年,其成果就是振聋发聩的推土机……当然,其实设计推土机的人和当时向AMD贡献EV8设计的DEC成员基本上不是一批人。

我们再回到ICUBE首席技术官的专利
这个专利就是重新思考在单片上集成CPU和DSP的方法
如果把在一个芯片上集成两个分离的CPU和DSP的通常的方法比做多核CPU那就是Power4路线,就是现在主流多核处理器的路线。
而这个专利上面的设计则就可以比作EV8路线。
这个处理器设计,既有CPU上比较有意义的数据缓存,也有DSP上比较有意义的集成SRAM;既有CPU上比较有意义的ALU/LS单元(这是做分支用的),也有DSP上比较有意义的专用累加器和可以做傅立叶变换的专用单元;然后还有一些两者皆适用的。
单个处理器整一个执行单元的能力是4发射,但是实际上运行的是一个2发射的CPU线程和一个2发射的DSP线程。

这个专利对应的设计好不好没能力细谈了
实际上这个专利设计肯定不等于现在的MVP核心
但是从多线程,和一个处理器又跑CPU又跑GPU来看,显然两者是有联系的。
具体的设计不清楚,但是指标是非常高的

这张图还谦虚了
其中DMIPS/Mhz指标,根据上面的DMIPS和Mhz来算一下,就可以看到MVP的4.3这个成绩是单核心的,而那些是整个SOC芯片的。
实际上1004K、1074K、Cortex A9的单核DMIPS/Mhz,是1.5、2和2.5(这也是mips和arm官网上的指标),那是远远逊于4.3的。
就算这个处理器单线程性能不突出,任何情况下都是4个线程平分这4.3的性能,单线程的DMIPS/Mhz是1.1左右,那这个600mhz的性能也约等于4枚600mhz的ARM9。
作者: u571    时间: 2012-1-18 16:10

DMIPS/Mhz这个指标说老实话水分很大。
作者: xx88    时间: 2012-1-18 16:21

等AMD的真Fusion出来看看是个什么样子吧
作者: dboy99    时间: 2012-1-18 16:25

补个IC1的核心图

作者: 卖哥    时间: 2012-1-18 16:38

图形运算16线程……
视频图像运算都有10线程……
原来4线程还只是对CPU任务而言的……
作者: dboy99    时间: 2012-1-18 17:25

有老外评论说这个东西的最大卖点是65nm下2.8mm^2的内核面积,如果用40NM工艺就能在一个常规PC处理器的封装面积内(200mm^2)封入100个以上的核心,细思甚惧啊!!!

ps.补一个单核心的对比图


[ 本帖最后由 dboy99 于 2012-1-18 17:28 编辑 ]
作者: 啊扑    时间: 2012-1-18 17:37

进来看技术宅的……

你们说的每一个字我都认得,连到一起我就读不懂了……
作者: 卖哥    时间: 2012-1-18 17:39

引用:
原帖由 dboy99 于 2012-1-18 17:25 发表
有老外评论说这个东西的最大卖点是65nm下2.8mm^2的内核面积,如果用40NM工艺就能在一个常规PC处理器的封装面积内(200mm^2)封入100个以上的核心,细思甚惧啊!!!
ARM11在65nm下的核心面积是1.77mm^2
也没看到100个以上核心的ARM11什么的……
实际上做出来的单核心产品面积也往往在20mm^2之上。
作者: Zico2003    时间: 2012-1-18 17:41

引用:
原帖由 卖哥 于 2012-1-18 16:07 发表
我看了下这个公司首席技术官的专利
让我想起一个东西
Alpha 21464,也就是EV8

那是一个多核处理器蒙昧时代的设计
当时的人们还不是特别清楚如何设计多核处理器

多核处理器是什么样子的呢?
蒙昧时期有两个 ...
AMD靠一个EV6也回本了……:D

[ 本帖最后由 Zico2003 于 2012-1-18 18:38 编辑 ]
作者: sunever    时间: 2012-1-18 17:47

谁说说这个产品以后用在什么东西上面

普通人用不用的到
作者: 卖哥    时间: 2012-1-18 18:03

我搜了下中文资料都是去年7月份的
我想怎么会一个去年7月份的话题会现在谈起来
然后看到dboy99转的图片地址……
原来这个企业最近被vr-zone访问过了
http://vr-zone.com/articles/icub ... olution-/14518.html
里面鬼子记者被煽动的那个激动呀……

从vr-zone的这张图片来看,已经流片成功了,目前应该在测试


就我的印象,3个月流片,3个月测试,3个月生产,最早的产品9个月之后就能拿出来了。
流片日期是去年7约,所以最快的情况下,今年4月份就能看到用这个芯片的实机参加国际电子消费品展览什么的。

[ 本帖最后由 卖哥 于 2012-1-18 18:09 编辑 ]
作者: 红叶    时间: 2012-1-18 18:28

技术白痴不懂的说,是不是猴机的新装备啊




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0