【人工智能】中国大模型行业的五个真问题 | 究竟应该如何看待国内大模型行业的发展现状 | 模型 | 算力 | 数据 | 资本 | 商业化 | 人才 | 反思

大飞说科技

24 Feb 202418:24

Summary

TLDR在这段视频中，大飞探讨了中国大模型产业的现状和面临的挑战。他提到，尽管中国公司在2023年密集发布了超过130个大模型，但许多模型被质疑是“套壳”，即直接使用或修改国外的开源模型。大飞指出，中国大模型产业存在五大问题：模型本身、算力、数据、资本和商业化，这些问题相互关联，难以单独解决。他强调，尽管大模型产业在中国迅速发展，但原创性和突破性发展受到资本短视和市场现实的限制。大飞还提到，中国大模型产业的未来趋势可能包括融资热度的下降、大模型应用的深入以及国产算力的重视，但同时也警告了可能出现的炒作和泡沫现象。

Takeaways

🚀 中国大模型产业在2023年发布了超过130个大模型，但存在原创性不足和“套壳”现象。
💡 OpenAI在大模型方向上的成功促使中国公司纷纷跟进，但面临技术和资源上的挑战。
🔍 部分中国大模型被质疑仅是重命名或拼装现有开源模型，缺乏真正的技术创新。
📈 OpenAI使用大量算力和数据，以及顶尖人才，经过多年才打造出GPT4，而中国公司在短时间内难以复制这一成就。
🤔 中国大模型产业面临算力、数据、资本和商业化等多重问题，这些问题相互关联，难以单独解决。
💼 算力成本高昂，中国公司在GPU等硬件资源上的投入有限，影响了大模型的研发和训练。
📊 数据质量问题突出，中文互联网数据质量普遍较低，且缺乏有效的数据保护和标准化服务。
📉 资本市场对大模型产业的投资趋于短视，追求快速回报，不利于长期技术积累和产品打磨。
📈 商业化路径不明确，B端市场对大模型的需求和接受度有限，C端市场短期内难以实现大规模付费。
⚙️ 国产算力的发展受到重视，但短期内难以看到明显进步，需要长期投入和研发。
🧐 人才问题背后反映的是教育和社会体制的深层次问题，需要更广泛的讨论和改革。

Q & A

中国大模型产业在2023年发布了多少个大模型？
-2023年，中国公司发布的大模型数量已经超过130个。
为什么说中国大模型产业存在问题，并且问题主要体现在哪些方面？
-中国大模型产业存在问题，主要体现在模型本身、算力、数据、资本和商业化五个方面，这些问题之间互为因果，每个问题都无法独立解决。
为什么说OpenAI在大模型方向上的投入和坚持是值得中国公司学习的？
-OpenAI在大模型方向上的投入和坚持值得学习，因为他们在算力、数据和人才方面都有持续的高投入，即使在面临“幻觉”问题时，也用了超过八年的时间才打造出突破性的产品GPT4。
中国大模型产业中的“套壳”现象指的是什么？
-“套壳”现象指的是部分中国大模型直接使用了国外的开源大模型，仅做了少量的调整，导致在一些检验大模型能力的榜单上排名靠前，但实际并非真正的原创。
中国大模型产业在算力方面面临哪些挑战？
-中国大模型产业在算力方面面临的挑战包括GPU价格昂贵、部署和运营成本高、以及创业公司难以承担大规模GPU购买和部署的风险。
为什么说数据是大模型产业的一个难以绕过的难题？
-数据是大模型产业的一个难以绕过的难题，因为高质量的数据获取和处理需要大量的投入，而中国市场上的数据服务多为定制化且成本高昂，同时市场上缺乏有效的数据保护手段。
资本短视对中国大模型产业有什么影响？
-资本短视导致投资人更倾向于快速退出获得回报，而不是长期投入和培育项目，这限制了大模型产业的长期发展和技术突破。
中国大模型产业在商业化方面面临哪些挑战？
-中国大模型产业在商业化方面面临的挑战包括C端付费用户增长缓慢、B端市场难以突破，以及大模型在专业场景中存在的“幻觉”问题影响实际应用。
为什么说中国大模型产业的发展需要撇开泡沫才能看清新机会？
-因为风口刺激产业迅速扩张的同时，泡沫也随之而生。只有撇开泡沫，才能更清晰地看到产业发展的真实情况和新机会，避免盲目跟风和资源浪费。
中国大模型产业的发展趋势有哪些？
-中国大模型产业的发展趋势包括融资热度下滑、大模型应用持续深入数字化程度高的领域、国产算力得到进一步重视但进步缓慢，以及需要找到新的变现模式。
为什么说人才问题是大模型产业发展背后一个更为深远的话题？
-人才问题是大模型产业发展背后一个更为深远的话题，因为它涉及到教育、社会体制等更深层次的因素，如钱学森之问所提出的，为什么我们的学校总是培养不出杰出的人才，这关系到整个国家的创新能力和未来发展潜力。

Outlines

00:00

🤔 中国大模型产业现状与挑战

本段讨论了中国大模型产业的现状，提到了2023年中国公司发布了超过130个大模型，但存在诸多问题。尽管OpenAI的大模型方向被认可，中国公司却面临原创性不足、算力和数据投入不足、资本短视和商业化困难等问题。同时，提到了大模型产业的五个核心问题：模型本身、算力、数据、资本和商业化，这些问题相互关联，难以单独解决。

05:01

📈 原创与套壳：大模型产业的真假问题

这一段深入探讨了中国大模型产业的三个主要类别：原创大模型、套壳国外开源大模型和拼装大模型。原创大模型因技术积累和高投入而风险巨大，而套壳和拼装模型虽然风险较低，却因强调原创性而导致内耗和刷榜现象。此外，算力问题也被提及，包括GPU的高成本、部署和运营的挑战，以及创业公司面临的算力投资风险。

10:04

📊 数据与资本：大模型产业的双重难题

第三段着重讨论了数据和资本问题。中文互联网数据质量普遍认为较低，且数据服务成本高昂，导致数据加工和清洗工作难以开展。资本方面，投资人倾向于短期内获得回报，导致创业公司难以进行长期的研发投入。同时，提到了投资人推动快速融资和上市的策略，以及中国专业投资机构面临的募资和退出限制。

15:07

🚀 商业化前景：大模型产业的未来趋势

最后一段预测了2024年大模型产业的商业化趋势，指出融资热度将下降，大模型将更深入地应用于数字化程度高的领域。同时，讨论了B端服务的挑战，特别是政府和国企对减少人力的抵触，以及大模型在专业场景中落地的困难。此外，提到了国产算力的重视和提升，以及可能出现的炒作现象。最后，提出了人才问题，暗示了教育和社会体制对产业发展的深远影响。

Mindmap

Keywords

💡大模型产业

大模型产业指的是利用大型机器学习模型来开发和提供智能服务的行业。在视频中，大模型产业被讨论为一个快速发展但存在问题的领域，特别是在中国。提到了中国公司在2023年发布的大模型数量超过130个，这表明了该产业的活跃度。

💡OpenAI

OpenAI是一个以开发通用人工智能（AGI）为目标的人工智能研究实验室。视频中提到OpenAI发布的ChatGPT，以及它在大模型产业中的领导地位和对行业方向的影响。

💡算力

算力指的是进行计算的能力，对于大模型产业来说，算力是基础之一，需要海量且先进的算力来训练复杂的模型。视频提到了英伟达的A100和H100芯片，以及它们在大模型训练中的重要性。

💡数据

数据是大模型训练的另一个基础，需要大量的、高质量的数据来提升模型的准确性。视频中讨论了中国大模型产业在数据收集、清洗和优化方面的挑战，以及数据保护和数据服务的现状。

💡资本

资本在视频中指的是投资于大模型产业的资金。讨论了资本对于产业发展的影响，包括投资人的短视和对于快速回报的期望，以及这对创业公司和产业发展的影响。

💡商业化

商业化是指将技术或产品转化为可以在市场上盈利的形式。视频中提到了大模型产业在商业化方面的挑战，包括C端用户付费的难度和B端服务的复杂性。

💡套壳

套壳在视频中指的是直接使用或基于国外开源大模型进行二次开发的做法。这种做法在一些中国大模型中被指出，引发了对原创性和技术创新的讨论。

💡原创大模型

原创大模型是指从零开始，通过自主技术积累和持续投入研发出来的大模型。视频中提到原创大模型的数量较少，且需要承担较大的技术和市场风险。

💡拼装大模型

拼装大模型是指将多个小模型组合起来，形成一个参数量较大的模型。视频中提到这种做法作为大模型产业现状的一部分，与套壳一样，是产业发展中的一个问题。

💡幻觉问题

幻觉问题指的是大模型在生成文本或响应时可能会产生不准确或虚假信息的问题。视频中提到，即使是最先进的大模型也存在这种问题，这在专业B端场景中可能导致难以落地的问题。

💡人才

人才在视频中指的是具有专业技能和知识的人员，对于大模型产业的发展至关重要。讨论了人才问题背后反映的教育和社会体制等更深层次的问题。

Highlights

中国大模型产业在2023年面临的问题和挑战，包括模型本身、算力、数据、资本和商业化五个方面的问题。

2023年，中国公司发布的大模型数量超过130个，但存在质量和原创性的问题。

OpenAI在大模型方向上的坚持和投入，包括算力、数据和人才方面的大量资源。

中国公司在大模型开发上的时间紧迫和资源投入不足，与OpenAI的长期投入形成对比。

部分中国大模型被指出是“套壳”，即直接使用了国外的开源大模型。

中国大模型产业的三个主要类别：原创大模型、套壳国外的开源大模型和拼装大模型。

原创大模型需要强大的技术积累和高投入，但风险很大。

大模型的价值需要通过商业化来证明，而市场上已有优秀基础大模型。

算力成本的上升和GPU资源的获取难度对创业公司构成挑战。

中国大模型产业在数据获取和处理上面临质量和成本的双重问题。

资本短视和退出压力导致中国大模型创业公司面临融资和商业化的压力。

中国大模型产业的商业化方向主要在B端服务，但面临政府和国企的阻力。

2024年AI大模型发展的趋势，包括融资热度下滑、应用深入和国产算力的重视。

中国大模型产业需要撇开泡沫，寻找产业发展的新机会。

人才问题是中国大模型产业发展背后的一个深远话题。

中国大模型产业的发展受到教育和社会体制等更广泛因素的影响。