DeepSeek(「深度求索」)突破冒起,除了获政府支持,本台再发现,亦靠「三大招数」,包括在香港集资、在晶片禁令「空窗期」囤货、以及利用美国免费开放AI资源等;而且是百度、商汤、华为等中国巨擘在制裁下仍急速发展的关键。另值得留意的是,今次与2023年一样,每当美国发布制裁时,中国便会高调推出「惊世」产品,声称能无惧制裁并超越美国。有台湾国防和美国智库学者向本台分析指,中国这「三招」已发展成熟,能抗衡美国,亦能在宣传战上建立强者形象。
- 【独家调查】被美制裁港企「金蝉脱壳」 港府涉暗助认证后「复活」
- 港四所大学助解放军研发军用卫星 分析:利用香港规避西方制裁
- 美国400制裁名单香港占24间公司、个人 香港领先中国
- 腾讯为被美国防部列「中国军方合作企业」呼冤 彭博:美中或加快脱钩断链
在美国严厉制裁下,中国竟在两年内诞生可媲美ChatGPT的「国产」AI DeepSeek,而且其开发及训练成本仅为其他大模型的不足5%,及仅用2千块英伟达(NVIDIA)晶片就可建成。本台深入发现,总结出「速成」背后三大关键。
DeepSeek成功之道一:在美国AI研发数据上「加工」
第一,在美国AI研发数据上「加工」。本台取得DeepSeek所属公司「北京深度求索人工智慧基础技术研究有限公司」的一份专利说明书。当中就「人工智慧模型训练资料集的建构方法」指出,具体实施时「需要建构用于大语言模型训练的资料集」,「数据的来源可以使用现有数据集,例如各种开源资料集,也可以是从自行取得的资料」,之后整理一套模型,可「在不增加额外的系统负担的情况下,使得资料管理及资料存取更加便利」。

事实上,日前多间美媒已引述知情人士指出,OpenAI及其合作夥伴Microsoft(微软)去年已开始调查DeepSeek盗用其模型进行开发。而OpenAI已掌握一些证据,显示DeepSeek透过「蒸馏」技术(distillation)来建造的,即以AI模型为模仿基础,来训练和改进,从而在低成本下达到同级的效果目标。另美国Meta免费开放的「Llama」亦疑是DeepSeek的「蒸馏」对象。
本台早前已报道,中国近年已成熟地利用美国开源模型进行开发,包括利用「Llama」并结合国产「百度」的「文心一言」、清华大学「智谱」研发的开源AI「ChatGLM」等大模型,提升解放军AI的作战能力。
DeepSeek成功之道二:民企、大学搜购大量美国晶片
第二,以「奇招」囤积美国晶片。即使中国向国内晶片业投资数以千亿元人民币,目前「最先进」的晶片是「中芯国际」7奈米晶片「麒麟 9000S」,然而在欠缺技术和零件设备下,亦无法取代ChatGPT主要运用的美国「英伟达」的A100和H100晶片。
那如何达到ChatGPT的级数?本台据中国官方资料发现,在2022年9月至2023年10月美国逐步扩大对华的晶片出口禁令期间,DeepSeek的母企「幻方量化」,与一众与中国政府关系密切的科企,包括百度、商汤、华为、腾讯、阿里以及字节跳动等大力投资AI的公司,分别囤购数以万张英伟达A100和H100晶片,继续其AI开发。尤其是制裁令实施初期,美方容许英伟达数月禁售「缓冲期」,包括推出性能稍低的A800及H800晶片供应中国。
本台亦发现,大学和中介公司亦是中国取得英伟达先进晶片的渠道。过去2年,北京航空航天大学、深圳大学、郑州大学、中国科学院大学和武汉大学和南方科技大学等十多高等科技院校,在美国制裁令下,仍一直招标采购英伟达A100和H100等晶片。

而幻方量化亦积极与大陆多所大学合作研发,并在大学招揽年轻科技精英组成研发团队;其模式与中国军民融合的发展模式相似。
DeepSeek成功之道三:利用香港对外集资
第三,「背靠祖国」并利用香港对外集资。虽然DeepSeek宣布成本仅需600万美元,惟遭外界质疑夸大事实,指出AI研发和生产资金成本,一般需至少数亿美元。
据公开资料,早计晶片,英伟达A100和H100等晶片,平均每枚需约2万美元。以DeepSeek宣布收购1万枚来计,已涉及2亿美元。
那DeepSeek的资金从何而来?本台发现,其除了借助中国政府大笔补助外,亦利用幻方量化旗下多个资产管理公司,筹集多达千亿元人民币,造就其成为中国国内量化私募领域的「四大天王」。
其中,资金主力之一是来自幻方量化在2019年成立的「幻方资本管理(香港)有限公司」。该公司取得香港证监会发出的「资产管理牌照」(9号牌),意味著在国际资本市场上获得了「通行证」,不仅可以直接参与境外的投资,还可管理运用海外投资者的资金,包括将外资送往大陆。
美智库:中国利用「三招」逃避美国的制裁
美国詹姆斯敦基金会(Jamestown Foundation)副研究员张昆阳(Sunny Cheung)指出,这「三招」已成为中国成熟模式,逃避美国的制裁。
张昆阳说:「问题是(美国制裁禁令)执行上,往往依赖公司的尽职调查(due-diligence)和上报商务部,导致出现漏洞和灰色地带。另一问题是香港作为国际金融中心,有自己的股票市场和金融体系,而这股票市场是否容易让中国集资?这是必然的。尤其是,Deepseek弹起后,从政府角度,中国望热钱(Hot money)或矽谷(Silicon Valley)资金重新流入中国市场,特别是中国人工智能的建设上。而现在美国仍未有很建全的对外投资规定(Outbound investment regulations) ,即未有严格限制美国资金流入中国。其实美国晶片禁令在2023年才执行,而2022年首提禁令,当中有1、2年的空窗期,让中国公司有机会大量搜购英伟达(Nvidia)晶片,或以不同名目设立子公司,继而与『乾净』且有能力取得高科技晶片的公司,透过中介人、或第三国的模式取得晶片,这是很常见的做法。」
另值得留意的是,今次Deepseek的震撼推出,正值美国特朗普政府蕴酿新一轮对华晶片禁令的时机。本台发现,情况与2023年美国最初推出晶片禁令时相似,当时中国相继推出宣称不逊于ChatGPT的百度AI文心一言,以及搭载中芯麒麟9000S晶片的华为Mate 60系列5G手机,大肆宣传突破美国的围堵。
侍建宇:Deepseek成绩对「大内宣」有很大帮助
台湾国防安全研究院副研究员侍建宇指出,这都是中国宣传战略,试图营造强者不败的气势。
侍建宇说:「就算不是世界级的东西,也是名列前茅的一个AI技术。所以此情况之下,它对『大内宣』也是有很大的帮助,尤其在这1、2年中国的经济不景之下。当然『大外宣』也是有效果的。因为毕竟它还是短期之内,造成了美国股票市场的震荡;从长期的角度而言,它最近几年向『全球南方』,尤其金砖国家,表现出其实中国是有能力带领她们在科技向前走。」
不过,侍建宇指出,虽然不少人质疑中国的AI和晶片发展「名过其实」,但仍要警惕中国发展的程度,以及训练AI的目的,包括窃取个人资料和监控,「因为这都是不透明的」。他又关注到,愈来愈多事实证明香港是中国规避美国制裁的集资和集资的「中转港」,所以他对香港前景并不乐观。
编辑:温晓平 网编:毕子默
文章来源:RFA
没有评论:
发表评论
注意:只有此博客的成员才能发布评论。