訂閱
糾錯
加入自媒體

誤差不到400票!16歲CTO帶隊,用5000個AI押中了美國選舉

2025-12-16 15:24
烏鴉智能說
關注

不找人聊,就能知道人在想什么?一群00后正在用AI改寫調研行業(yè)。

2024年,一群平均年齡18歲的年輕人用約5000次AI對話(每次僅需30-90秒),便以接近零的成本,成功預測了美國紐約州民主黨初選的結果,票數(shù)誤差不到400張。

不到兩年,這群年輕人所創(chuàng)立的AI調研公司Aaru,已拿下埃森哲、安永和IPG等頂級合作伙伴,并在2025年底以10億美元估值完成5000美元A輪融資。

這一切的背后,是一個簡單到近乎狂妄的理念——用“無限模擬”取代“有限樣本”。

Aaru的核心不是讓AI變得更會“問問題”,而是讓AI學會“當人”。他們訓練了成千上萬個AI智能體,每個都被賦予復雜的人口屬性和行為認知模式,像一個微縮版的真人。

當這些“合成人”在數(shù)字世界里相互作用,就能回答以前無法回答的問題,如人群面對新產品、新政策或新廣告時的集體反應。

Aaru所代表的“合成行為”處于技術棧頂層,它正與其他“合成互動”(如Keplar、Outset)與“合成數(shù)據(jù)”(如Gretel、YData)的探索者,重塑價值800億美金的調研市場。 

/ 01 /

當AI Agents像人一樣思考

當市面上大多數(shù)AI競爭者還在圍繞“如何更高效地收集人的洞察”展開角逐時,Aaru的思路有點不一樣:如果不依賴真實的人,而是直接“合成”出無限個能模擬人類行為的數(shù)字智能體,來預測群體反應呢?

他們的核心叫做“仿真預測”,“建模-模擬-預測”,主打一個“如果……會怎樣?”的動態(tài)推演。

技術路徑是訓練出大量AI Agents(多智能體系統(tǒng),MAS),這些Agent依賴于多個來源的結構化和非結構化數(shù)據(jù),如社會經濟統(tǒng)計、消費者行為數(shù)據(jù)、社交媒體情緒信號等。

每個智能體不僅攜帶年齡、收入等標簽,更被賦予了行為模式、決策動機甚至認知偏好,相當于一個個“仿真用戶”。

把這些智能體組合起來,就形成了一個動態(tài)、可交互的人類行為知識庫。換句話說,這不止是合成數(shù)據(jù),它直接合成了人。

 

圖片

比如,Aaru訓練出特定人群標簽如“25-30歲一線城市白領”后,會模擬其決策邏輯,例如面對企業(yè)新產品時是否購買、面對公共事件時的態(tài)度傾向等。

這些“合成人”能做什么?

Aaru找到了一個極致展現(xiàn)自身優(yōu)勢的“燈塔場景”——政治選舉預測。

他們用約5000次AI問答(每次僅需30-90秒),成功預測了2024年美國紐約州民主黨初選的結果,與實際票數(shù)相差不足371票,而成本據(jù)稱只有傳統(tǒng)民調的1/10。

如果交給傳統(tǒng)市場調研,可能耗時數(shù)周、花費數(shù)十萬美元。

這個場景具有結果公開、驗證周期短、勝負分明的特點,其成功預測且成本極低,成為了其技術能力的“鐵證”。

Aaru的準確率也得到了認可。IPG(洲際傳播集團)的首席解決方案官評價,Aaru的準確度“高于任何網(wǎng)站調查、民調或焦點小組”。

除了政治選舉,Aaru的應用還伸展到企業(yè)決策和公共策略等領域。項目規(guī)模也能彈性縮放,從幾個智能體的小測試到十萬量級的大規(guī)模模擬都能支持。

目前,Aaru的產品主要分為三塊:

①Lumen,面向企業(yè)決策模擬。它能模擬企業(yè)高管、高凈值客戶等難以觸達的群體,用于產品概念測試、超定向營銷策略驗證等。目標受眾如“每年消費3萬美元購買手袋的人群”,“農村市場中患有糖尿病的新手父母”。

②Dynamo模擬人性,專注于選舉預測。通過讓大量智能體持續(xù)接收并處理信息,模擬選民接觸媒體并更新觀點)。在政治選舉場景中,每個AI智能體會持續(xù)接收信息,模擬真實選民如何獲取媒體內容并更新觀點,從而替代傳統(tǒng)民調來預測選舉結果。

③Seraph,則為公共部門設計,其支持配置任意時間、地點和媒介環(huán)境,用于在動態(tài)環(huán)境中模擬輿情與信息傳播,以輔助高風險決策。

目前,Aaru已經與IPG合作成立了“模擬工作室”(Simulation Studio)。

簡單來說,IPG將把Aaru的“人群模擬”能力,接入自家的消費者數(shù)據(jù)平臺Acxiom。這意味著,在合法合規(guī)使用數(shù)據(jù)的前提下,模擬出的人群畫像將更精細、更貼近現(xiàn)實,從而幫助品牌進行細分和市場觸達。

值得一提的是,推動這套設想落地的,是一個平均年齡僅18歲的年輕團隊,其中公司的CTO更是只有16歲。

Cam Fink,20歲,聯(lián)合創(chuàng)始人&CEO,有Kleiner Perkins、RSI等機構工作/研究經歷;

Ned Koh,20歲,聯(lián)合創(chuàng)始人,曾就讀于哈佛大學,有西北大學研究、創(chuàng)企聯(lián)創(chuàng)的經歷;

John Kessler,16歲,聯(lián)合創(chuàng)始人&CTO。

數(shù)據(jù)是新的黃金。Aaru正用一套近乎科幻的方法,嘗試撬動依賴經驗和樣本的傳統(tǒng)調研行業(yè),巨頭們的入場與合作,已經是一個不容忽視的信號。

/ 02 /

用“無限模擬”,取代“有限樣本”

800億美金調研市場背后的勞動力體量龐大,傳統(tǒng)模式的核心是“抽樣-詢問-統(tǒng)計”,其瓶頸在于樣本的有限性、成本的高昂與反饋的滯后。

AI正以兩種路徑重塑這個行業(yè):

(1)訪談增強類

第一類公司聚焦于研究流程的“前臺”,用AI模擬互動過程(訪談),但仍與真人交互。

壁壘在于自然交互技術和流程自動化,通過規(guī);@取定性洞察,捕捉語氣、表情等非語言線索,試圖獲取更深層的情感與行為洞察。

①AI語音訪談調研Keplar

Keplar是一款AI語音訪談平臺,用語音AI替代傳統(tǒng)人工訪談。其亮點在于多模態(tài)對話真實性:AI主持人能以"Ellie""Andrew"等擬人化身份進行語音訪談,參與者常忘記對方是AI,對話錄音中甚至能聽到直呼AI名字的自然互動。

它將任意產品問題轉化為訪談指南,直接調取CRM客戶名單并發(fā)數(shù)百通語音訪談,實時分析回答主題。

與傳統(tǒng)調研公司相比,將訪談周期從數(shù)周壓縮至數(shù)小時,成本降至幾十分之一。差異化在于語音優(yōu)先,通過語音語調、停頓節(jié)奏建立信任,獲取更深層的情感化反饋,其交付物是可直接用于匯報的PPT和報告,而非原始數(shù)據(jù)。

②視頻深度訪談Listen Labs

Listen Labs是紅杉資本重注的AI用戶研究平臺,累計融資2700萬美元。其獨特之處在于視頻訪談的深度與規(guī)模平衡:AI主持人可進行視頻訪談,參與者通過視頻、語音、文字或屏幕共享回應,還原了面對面訪談的豐富度。

核心差異是視頻+AI分析的組合。平臺強調"定量規(guī)模的定性深度",能同時執(zhí)行數(shù)百個視頻訪談,AI自動編碼回答、識別主題并生成報告。

Listen Labs捕捉視覺線索,如表情、操作行為、環(huán)境背景,更適合UX研究和產品測試。其客戶覆蓋消費品、醫(yī)療等大型企業(yè)。

③AI主持人訪談Outset

Outset專注AI主導的深度訪談,總融資2100萬美元,由8VC領投、貝恩資本參與。其平臺讓AI主持人通過視頻/語音與數(shù)千名參與者對話,自動合成結果。

核心亮點是超大規(guī)模與速度:25個深度訪談傳統(tǒng)需4-6周,Outset可在1周內完成250個訪談并自動分析,速度提8倍、成本降81%倍。

差異化在于全研究流程自動化,從創(chuàng)建討論指南、招募受訪者到分析結果、生成報告,研究團隊只需輸入研究問題,平臺自動處理其余環(huán)節(jié)。

客戶包括雀巢、微軟、慧儷輕體等500強企業(yè)。與Listen Labs相比,Outset更強調端到端自動化和企業(yè)級集成能力,適合需要快速、大規(guī)模獲取客戶"為什么"的復雜研究項目。

④神經營銷AI平臺Neurons

Neurons專注廣告和創(chuàng)意效果預測,基于認知神經科學、機器學習與心理學構建。其亮點是秒級注意力預測:上傳廣告素材,AI在數(shù)秒內生成熱力圖,預測觀眾注意力分布,并給出參與度、廣告回憶度等KPI評分。

平臺服務于廣告代理商和品牌營銷團隊,解決"創(chuàng)意是否有效"的痛點,減少反復修改。

與訪談類平臺收集用戶"說"什么不同,Neurons測量用戶"看"什么,預測下意識反應。其核心價值是數(shù)據(jù)驅動創(chuàng)意決策,在投放前識別最佳素材,降低風險,提升ROI。

⑤AI用戶研究平臺Synthetic

Synthetic核心是通過模擬訪談收集產品反饋。其技術基于多智能體系統(tǒng),調用GPT、LLaMA、Mistral等模型,每個合成用戶采用五因素人格模型(FFM),模擬認知偏差與行為模式,在和真人對話中調整信任度與語氣。

平臺支持企業(yè)上傳歷史訪談、客服工單等專有數(shù)據(jù)來定制合成真實的用戶背景。

其客戶主要來自制藥、汽車、消費品等行業(yè),平臺通過SOC 2認證并提供API接口。某藥企案例顯示,專家訪談周期從3個月縮短至數(shù)小時。平臺公開披露其合成結果與真實用戶洞察匹配度約為85-92%。

(2)合成數(shù)據(jù)公司

第二類公司則專注于技術“后臺”,即數(shù)據(jù)本身。壁壘在于數(shù)據(jù)保真度、隱私合規(guī)與系統(tǒng)集成,負責為上層模型和傳統(tǒng)分析提供安全、優(yōu)質的“燃料”。

①開發(fā)者友好的合成數(shù)據(jù)API平臺Gretel Labs

Gretel Labs核心亮點是即時生成與隱私保證。它提供面向工程師的SDK和API,可在現(xiàn)有數(shù)據(jù)管道中無縫嵌入,幾行代碼即可生成高保真合成數(shù)據(jù)。其自定義生成式AI模型能合成文本、時序數(shù)據(jù),可跨表關系保持完整性,適合金融交易、醫(yī)療記錄等復雜場景。

Gretel服務Techstars、HelloFresh等科技公司,滿足開發(fā)測試、數(shù)據(jù)共享等高頻需求,其壁壘在于低摩擦集成和模型泛化能力,而非復雜的UI或咨詢服務。

②企業(yè)級合成數(shù)據(jù)平臺Tonic.ai

Tonic.ai專注為財富500強提供生產數(shù)據(jù)"去敏化"方案。其差異化在于數(shù)據(jù)庫子集化與關系保真:能從PB級生產數(shù)據(jù)庫抽取代表性子集,同時保持跨表外鍵關聯(lián)、時間戳邏輯和業(yè)務流程完整性,這對測試復雜企業(yè)系統(tǒng)(ERP、CRM)不可或缺。

技術上采用結構感知生成,先解析數(shù)據(jù)庫Schema,再逐表訓練生成模型,確保合成數(shù)據(jù)在結構上與原系統(tǒng)100%兼容。其客戶覆蓋Adobe、eBay等,核心價值是合規(guī)替代傳統(tǒng)數(shù)據(jù)脫敏,避免掩碼、加密導致的測試覆蓋率不足。

③數(shù)據(jù)隱私與分析增強平臺YData

YData的獨特之處在于合成數(shù)據(jù)與數(shù)據(jù)質量閉環(huán)。它不僅生成數(shù)據(jù),更前置診斷數(shù)據(jù)缺陷(缺失值、偏差、不平衡),再針對性合成補充樣本,提升模型訓練效果。

它的Fabric平臺覆蓋從數(shù)據(jù)標注、生成到模型訓練的全流程,尤其適合自動駕駛、金融風控等對數(shù)據(jù)質量敏感的領域。

與多數(shù)主打隱私保護的合成數(shù)據(jù)工具不同,YData強調自己是一個“AI開發(fā)加速器”,其合成數(shù)據(jù)不只“看起來像”真實數(shù)據(jù),更追求讓下游AI學得更好、預測更準。

無論是“前臺”還是“后臺”,他們共同指向一個轉變:市場研究正從依賴“有限樣本”的被動收集,邁向運用“無限模擬”的主動預測。一個由AI驅動、速度與深度并重的新研究時代已是歷史趨勢。

文/朗朗

       原文標題 : 誤差不到400票!16歲CTO帶隊,用5000個AI押中了美國選舉

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號