如果说目前高端集成电路的落后现状是因为我国相关产业起步晚, 积累少导致的, 对于如今再次兴起的人工智能浪潮, 中国已经深度参与, 并在若干技术及应用领域占据了世界第一梯队的位置.
但是, 如果将AI产业链进行分层的话, 以AI芯片, 大数据, 算法为代表的基础层直接决定了中间技术层及应用生态的上层建筑发展情况 . 那么在世界各主要强国逐鹿AI话语权这个看不见硝烟的战场上, AI芯片就成为不容有失的战略制高点.
在近期AI科技大本营对天数智芯CEO李云鹏的一篇专访文章中 (专访天数智芯李云鹏: 两年时间一定要做出自主可控, 国际一流的AI芯片) , 李云鹏表示, 要用两年时间造出自主可控, 国际一流的AI芯片. 如此豪言壮语在现阶段听来自然是振奋人心, 然而, 外界对于天数智芯核心团队的构成, 造出AI芯片的到达路径等问题仍然雾里看花, 为此AI科技大本营再次走进天数智芯, 独家专访了其硬件团队的核心成员, 以期为读者揭开这匹造芯黑马的神秘面纱.
接受本次专访的有天数智芯系统技术部负责人董焱和AI系统架构师李庆恩 (Alex Lee) .
▌ 硬件团队的构成: 百人团队, 硅谷, 上海两地布局
目前, 天数智芯的硬件团队主要集中在硅谷, 上海两地. 上海团队以资深的GPU芯片专家为主, 团队规模在90人左右. 硅谷团队的核心研究方向为人工智能及高端计算芯片, 团队规模在20人左右.
作为天数智芯系统技术部门的负责人, 董焱1985年毕业于浙江大学, 有着深厚的芯片从业背景. 他已在硅谷工作, 生活20多年, 加入天数智芯之前曾在芯片巨头AMD工作了近20年. '可以说, 我的主要职业生涯都在做芯片' , 董焱表示, 硬件团队的核心成员很多都是芯片行业出身, 在一起工作了十年以上, 相互之间非常了解, 从这种角度来说, 天数智芯并不是一家初创公司.
李庆恩 (Alex Lee) 本科毕业于中国台湾清华大学, 硕士就读于UCLA, 毕业后进入英特尔实验室 (Intel Labs)任全职资深研究员一年, 专攻机器学习于全双工通信基带芯片中之实现. 密歇根大学就读博士期间, 在英伟达 (Nvidia)架构研究组实习, 研究开发深度神经网络处理器架构. 目前的研究方向为特定场域(domain-specific)软硬件加速系统.
▌ 不是谁都可以随意造芯: 成功造芯需要具备这三大条件
对于目前行业的造芯热潮, Alex表示, 要想取得成功需要具备三方面条件:
第一, 市场牵引 . 任何创业都不是所谓的 '科技推动' , 只有 '市场牵引' 出人们的需求, 才会有真正的科技创新. '学术界做了很多芯片研究, 发完论文就扔了, 我们开玩笑叫它们是 '硅片垃圾'' . Alex强调, NVIDIA之所以能够成为世界级的芯片公司, 是因为他们不仅重视研发, 而且所有的研究都是为了出产品, 不是为了做研究而做研究. 如果没有市场做支撑, 流片一次需要几百万美金, 而且还有可能会失败, 初创的公司没有条件进行这样的尝试.
第二, 团队 . 要判断一个初创公司能不能成功造芯, 首先需要先研究他们的成员架构, 如果团队中没有一批在芯片行业中从业15-20年, 拥有绝佳的默契以及高效的执行力, 成功的可能性是相当渺茫的. 对于目前的天数智芯来说, 核心团队组成绝大部分都是资历非常老的专家. 在此基础之上, 加以注入年轻的新血, Alex表示: '我们现在拥有的是一支最趋近理想的研发团队. '
第三, 资金 . 芯片是一个非常烧钱的行业, 没有长期持续的大额资金的投入是无法支撑的, 同时芯片是一个需要长期深耕的基础设施领域, 它的发展需要资金, 人才和技术的全方位支持. 对于投资者应该抱有的态度, Alex呼吁: '不管是风投机构还是国家战略投资, 重要的是给予芯片初创企业足够的时间来蓄力及积累. '
对于资金问题, 熟知芯片工艺流程的董焱表示, 一次流片需要300万-500万美元起跳, 如果是最新的7纳米工艺则需要上千万美元, 这个价格的前提是需要一次就成功. 只有做到性能达标, 成本受控的产品才会有竞争力, 但这中间的生产流程也非常考验团队的管理能力, 稍有不慎就会亏本.
▌ AI芯片的到达路径: FPGA沿途补给, ASIC是最终方案
对于AI芯片的架构, 目前行业里有CPU, GPU, FPGA, ASIC等几种解决方案. 董焱披露: '天数智芯最终是要做GP-GPU, 因为只有GP-GPUASIC才能即满足高端计算的市场需求的同时也提供最高的性价比, 但在某些特定的场合, FPGA还是拥有极大的优势及庞大的市场. '
对此, Alex补充道: '天数智芯目前同时致力于云端运算一体机, 边缘运算一体机, AI芯片的研发. 其中云端, 边缘运算一体机都着力使用了FPGA的解决方案. FPGA虽然定位为天数智芯战略道路上的一个中继站, 然而其所能体现的加速, 运算能力的提升, 功耗的降低, 系统的完整性, 都使其价值远远超越一个过渡性产品. 在围绕FPGA做解决方案的时候, 我们研发团队为快速迭代开发应用, 在高层次综合 (High-Level-Synthesis) 技术之上进一步提升其效能及效率. 在边缘运算一体机产品中, 一片客制化FPGA板卡, 加上高层次综合生成之人工智能及数据库加速 IP, 就是一个完整的工业级的解决方案. 而将板卡插在云端服务器上即成为了云端运算一体机的核心, 可轻易的为客户提供硬件加速服务 (H aaS)之服务. 所以云端, 边缘运算一体机是一脉相承的, 它们为现有客户提供快速有效的解决方案, 是公司发展的落地化现金流业务. '
而AI芯片是公司发展最有价值的愿景, 它的终极目标是是做出通用, 标准, 高性能并且可扩展的解决方案, 然而这需要时间的沉淀和洗礼. Alex认为, 天数智芯的FPGA 业务会不断带来市场上的反馈, 为通用, 标准, 高性能的计算芯片带来宝贵的迭代机会, 这也是CEO李云鹏一再强调的整体战略时间线.
▌ 总结: 与苹果一样做系统公司, 从芯片到应用打造完整生态
至此, 天数智芯这家芯片黑马的宏伟蓝图已全面展开. 不过, 也许它不仅仅是芯片业的黑马.
正如CEO李云鹏所说, 天数智芯不仅仅是一家芯片公司, 而是一个系统公司. 对于系统公司的概念, 李云鹏表示, 有一家公司既做手机APP (日历, 天气, 股票……) , 又做APP store和操作系统, 还做手机芯片, 这家公司叫苹果, 它也是系统公司, 只是苹果是 to C型系统公司, 而天数智芯为 to B型系统公司.
在硅谷的团队主打系统和芯片架构的引领, 南京的软件团队向上做机器学习和大数据平台的软件应用, 上海的硬件团队则基于已有的软件市场和生态向下做基础层的芯片解决方案, 从而形成从芯片到系统到应用的完整生态链.
虽然瞄准全生态链的搭建, 但董焱表示, 公司跟国内的互联网巨头都没有太大的竞争, 本质上是不一样的公司. 由于AI芯片领域现存的问题为尚不存在一个通用的算法可以包打天下, 那么基于算法的AI芯片就跟应用场景强相关. 很多创业公司面临的一个难点是, 在解决某一个场景的计算问题时, 往往需要该领域的用户提供支持, 但用户在没有看到解决方案的情况下是很难提供有效支持的, 这就变成了先有鸡还是先有蛋的问题.
'而这正是天数智芯的优势, 依托现有产品和用户, 就可以开发出自主知识产权的解决方案, 这样成功率很高, ' 董焱表示.