让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

拆伙融资、拆伙PR、拆伙膨胀: 一个商量者如何作念出10亿好意思元的AI公司

新闻

你的位置:亚洲视频第一页 > 新闻 > 拆伙融资、拆伙PR、拆伙膨胀: 一个商量者如何作念出10亿好意思元的AI公司


拆伙融资、拆伙PR、拆伙膨胀: 一个商量者如何作念出10亿好意思元的AI公司

发布日期:2025-12-15 14:38    点击次数:166

在大模子圈,有几家名字东说念主东说念主都知说念:OpenAI、GoogleDeepMind、Anthropic。

但在这些名字背后,还有一家简直不作念PR、从不上面条的公司——SurgeAI。

不到四年时候,这家公司用不到100东说念主的团队,作念到年收入超10亿好意思元;从零运行到今天,它从未融过一分钱VC,从第一天起就盈利。

更关节的是:ChatGPT、Claude、Gemini等一线模子,在后历练、评测、对皆阶段都不同进度地用过Surge的数据和器具。

这意味着,在决定“模子该长成什么样”这件事上,Surge站在了一个极其掩饰但关节的位置。

Surge创举东说念主EdwinChen的身份也不典型:他不是“运动创业达东说念主”,而是通盘从MIT到Google、Facebook、Twitter作念机器学习商量的学术型工程师。而当他果然创业时,他简直把硅谷主流脚本全部按了“反选”——

在一派“融资—膨胀—估值”的喧嚣里,他用一套简直反主流的选拔,作念出了10亿好意思元公司,也把我方定位为:与其说是创业者,不如说是“下一代AI的养父”。

1

“我不念念上那辆硅谷跑步机”

要是要给Edwin的创业玄学找一句话,有时是他在访谈中的原话:

在大科技公司待过的东说念主,大多眼光过“组织肥美”的威力;Edwin的嗅觉则更极点——他曾在多家大厂责任,恒久认为:“要是裁掉90%的东说念主,公司会跑得更快。”

于是到我方创办Surge时,他干脆把这种直观酿成公司谋划原则:

在融资问题上,他选拔了更少东说念主敢走的路:皆备不融VC。

在今天的硅谷,这简直等于主动消灭一整套“增长加快器”:

莫得风投帮你站台发声、莫得估值数字帮你上面条、也莫得“新一轮融资完成”的新闻鼓动招聘和互助。

代价是彰着的:莫得PR光环,Surge很永劫候都“名不见经传”;他们的增长,简直皆备依赖一种最原始、也最难的式样——居品好到商量员欢快口耳相承。

但Edwin认为,这是惟一能保证公司不被“硅谷机器”带偏的旅途:

他不肯意把时候花在路演、惩处媒体辩论上,而是宁可困在数据集和实验呈报里,沟通如何让下一版模子的步履更可靠极少。

在这种设定下,Surge反而被动把每一件事作念到极致:你莫得VC的背书、莫得PR的放大器时,剩下惟一能劝服前沿实验室的,只剩下成果。

1

他赌的那件事:把“高质料数据”作念到极致

Edwin的配景,决定了他赌的标的——不是作念模子,而是作念“模子背后的那层水”。

他从小同期千里醉数学和言语学,其后在MIT念书,又去了Google、Facebook、Twitter作念机器学习商量。

在这些公司里,他一遍遍遭遇并吞个问题:念念历练好模子,却拿不到实足好的数据。

在大多数互联网公司,所谓“数据标注”,每每意味着两件事:

用多数低价劳能源作念简便打标——“这是不是猫?”“这个框是不是车?”

用极端简略的规则臆想质料——“有莫得填满?”“有莫得按方法来?”

这套逻辑在“图像分类”时间还能对付,

但在大模子时间,成果等于:模子在式样上及格,在实验上日常以至无益。

GPT-3发布时,他意志到:要是模子果然要走向“能写论文、能作念商量、能缓助科学发现”的阶段,“写得有模有样”远远不够,模子需要被教导什么是“真恰巧的东西”。

于是,他在GPT-3发布一个月后创立Surge,给公司定的标的极端单一:只作念一件事——用极高程序的东说念主类数据,历练和评估模子。

在访谈中,他用一个小例子阐扬什么叫“高质料”:

为了在范围上作念到这种主不雅条目,Surge作念了一件别东说念主懒得作念的事:给每一个标注者、每一个任务会聚泛滥成灾条步履信号。

不仅看他终末打了什么分,更看:

打字节律、反适时候;他我方写出来的文本或代码质料;基于他数据历练后的模子,在真实任务里有莫得变好。

再用一整套里面模子去判断:谁在哪些界限是真实“有品位的东说念主”。

这听起来有点像GoogleSearch的演化:先是把垃圾实验和死链全部扫掉,再在剩下的海量实验里,冷静学会“谁是果然好页面”。

Edwin的逻辑是:你认为什么是好数据,最终就会决定模子认为什么是“好谜底”。

这不是工程细节,而是价值不雅问题。

1

拆伙“为小报读者优化模子”

在谈到当下大模子行业时,Edwin的月旦极端成功——他认为,许多实验室正在被特地的办法函数带偏。

第一个被点名的是各式排行榜和基准测试,尤其是LMSysArena这么的“灵通投票榜”。

在这类榜单上,来自全寰宇的用户不错对比两个模子的修起,选拔“更好”的阿谁,以此决定排名。

在名义上,这是一套“民主评比最好模子”的机制;但在Edwin眼里,它更像给模子谋划的一套“标题党历练营”。

因为绝大多数投票者不会花时候作念事实核查,他们只会扫两秒,就凭证“看起来更利害”的那一条点票——emoji多极少、加粗多极少、多级标题多极少、篇幅长极少,

就比一个简易、严慎、讲授的修起更容易告捷。

Edwin说,Surge我方商量LMSys数据后发现:

问题在于,统统贸易链条都被这个榜单绑住了:

企业客户买模子时,会问:“你在LMSys上排第几?”

销售团队为了签单,只可把榜单当宣传单;

商量员的绩效、擢升又跟“模子进榜”挂钩——即使他们极端澄清,为这种榜单优化,会让模子在准确性和指示谨守上变差。

这条链条通盘延迟下去,终末把统统行业导向了一个危急的站位:咱们正在为“超市门口买小报的东说念主”优化AI,而不是为真义优化。

Edwin还有另一层担忧,来自他在Twitter、Facebook作念保举算法的阅历。

他澄清地知说念,当一个系统的办法函数从“信息质料”酿成“用户参与度”时,会发生什么——标题党、极点言论、猎奇图片速即占领屏幕,因为它们最能勾起多巴胺。

而把这套逻辑移植到大模子上,等于当下你频繁能看到的征象:模子荒诞夸你有多智谋、多前瞻;陆续顺着你的偏见讲故事,而不是教唆你“这件事其实很复杂”;在皆备不进攻的小事上陪你反复打磨,破钞你多数时候。

他讲了一个很小、但很典型的例子:有一次他用Claude改一封邮件,改了30个版块,终末舒心地发出去了。

然后他瞬息意志到——

于是问题酿成:你到底但愿你的模子如何对待你?

是那种长期说“太棒了,咱们还能再试20个版块”的好好先生?

照旧那种在顺适时候会告诉你:“这里也曾够好,快去作念更进攻的事”?

这背后等于不同的办法函数:前一种对“对话时长”负责,后一种对“东说念主类的时候和生存质料”负责。

1

“公司等于你的办法函数”

要是把Edwin的故事压成一句话,有时是:他在用一家公司,活出我方肯定的那套办法函数。

在访谈末尾,他说了一句很“反鸡汤”的话:

对他来说,这件事情等于:在大模子时间,厚爱地修起“什么是好数据、好模子、好办法函数”这几个看起来无聊的问题,并把它们极少极少作念进居品、作念进客户辩论、作念进公司文化里。

他给创举东说念主的提议也很简便:

不要靠不休pivot去“找市集”,而是先问澄清:有莫得一件事,是莫得你就不会有东说念主去作念的?

不要只看“什么姿色当今最容易融资”,而是问:“要是十年后失败了,我是不是仍然认为这件事值得?”

在AGI这场竞赛里,模子参数、算力范围、排行榜排名诚然进攻,但Edwin给出的视角更底层:

换句话说——你等于你的办法函数,一家公司亦然。

而当今,这家拆伙融资、拆伙PR、拆伙膨胀的10亿好意思元公司,正在用一种极其逍遥的式样,把我方的办法函数,写进下一代AI的成长轨迹里。

点个“爱心”,再走吧



下一篇:没有了

Powered by 亚洲视频第一页 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2025