2025-05-13
雲運算與生成式 AI(Generative AI)的急速發展,顛覆了人們的學習、工作、生活以至娛樂模式。而 AWS 亦致力透過高效數據處理與人工智能分析,提升賽事的公平性、觀賞體驗及運動數據管理。自 2018 年起,AWS 與 Formula 1(一級方程式賽車,F1)展開緊密合作,透過人工智能及雲運算,解決賽車運動最核心的問題 ── 如何有效處理龐大的賽事數據,並提升賽車迷的觀賽體驗。
F1 賽車每場比賽都會產生海量數據,包含車輛性能、賽道條件、車手操作數據等,AWS 透過數據湖(Data Lake)技術整合所有資訊,並運用機器學習(Machine Learning,ML),發掘車迷最關心的問題。
2025-04-15
Amazon 早前宣布推出全新基礎模型 Amazon Nova Sonic,將語音理解與語音生成統一於單一的模型中,使 AI 應用程式中的語音對話更貼近真人交流。該模型透過 Amazon Bedrock 上的 API 提供,可簡化語音應用開發流程,例如客戶服務通話自動化,以及涵蓋旅遊、教育、醫療、娛樂等領域的跨行業 AI agents。若要讓語音 AI 創造更多實際價值,必須能夠理解人類對話的微妙與複雜性。對話中,文字本身承載著意義,不過若缺乏聲音語境為它賦予深度,僅憑文字往往難以傳達完整資訊。如何表達與表達甚麼同樣重要,甚至更為關鍵。從過去直到現在,透過 AI 實現這一點仍是重大挑戰。
傳統語音應用開發須協調多個模型,例如將語音轉為文字的語音識別模型、理解並生成回覆的大語言模型(LLM)、將文字再轉為音檔的文本轉語音模型。這種分散的方法不僅增加了開發的複雜性,同時也難以保留自然對話中至關重要的聲學情境和細微差別,如語氣、語調韻律和說話風格等。
2025-04-07
2025-04-01
生成式 AI 的商業化應用正不斷擴展,從智能客服、市場推廣到市場分析,生成式 AI 正逐步成為驅動商業模式變革的核心技術之一。過去數月間,各大科技公司爭相推出新的大模型,如 Google 的 Gemini 2.5、OpenAI 的 o3、Meta 的 Llama 3.3、X(前 Twitter)的 Grok 3、Anthropic 的 Claude 3.7、Amazon 的 Nova Premier、Microsoft 的 Phi-4,還有話題王 DeepSeek 的 R1 和 V3 等。阿里雲亦不甘後人,近日宣佈推出端到端多模態 AI 模型 Qwen2.5-Omni-7B,展現多模態生成能力及高效能應用場景。
Qwen2.5-Omni-7B 專為全模態感知設計,能處理文本、圖像、音檔及影片等多模態輸入,並實時生成自然語言對答,適用於手機、筆記本電腦等終端設備的部署。儘管僅採用輕量級的 7B 參數,Qwen2.5-Omni-7B 的應用前景仍相當廣泛,包括即時語音導航協助視障者辨識周邊環境、分析影片中的食材提供烹飪指導,以及創建理解客戶需求的智能客服對話體驗。
2025-03-26
面對全球經濟下行和港人北上消費等行為變化的雙重挑戰,本地零售業急需創新突破,而生成式 AI 等創新科技,也許正是帶來突破的機遇。有見及此,AWS 上周四在港舉辦零售行業論壇,探討雲端和生成式 AI 科技的最新應用案例與未來趨勢。提及線上零售,Amazon 可謂鼻組級平台。其電子書平台很早期便已利用 AI 針對用戶的個人喜好及購物記錄,推薦相關產品並取得空前成功。隨著技術及業務拓展,現時 AWS 多款方案亦透過生成式 AI 的應用方式,聚焦客戶為本、產品為本、員工為本及資訊科技為基礎四大範疇,為零售及消費品業務革新體驗。
AWS 全球消費品、餐飲及零售業務發展部門主管 Justin Honaman 形容,生成式 AI 為採購和合約管理,帶來了革命性的改變。企業可利用文字模型分析 PDF 或 Word 格式的合約,快速完成價格核對、付款條款及合約條款的合規檢查,既能提高效率,更有助減少人工操作的失誤可能性,令企業能專注於核心業務。