Foundation model (model bazowy AI), definicja i kontekst biznesowy, yesfor

Pojęcie zostało wprowadzone w manifeście "On the Opportunities and Risks of Foundation Models" zespołu Stanford Center for Research on Foundation Models w sierpniu 2021. Autorzy (m.in. Rishi Bommasani, Percy Liang, Dan Jurafsky) argumentowali, że trening modelu raz, użycie wielokrotne dla różnych zadań, zmienia ekonomię AI w sposób porównywalny do wprowadzenia stosu LAMP w hostingu webowym.

Cztery cechy definicyjne

Stanford CRFM Foundation Models Report wymienia: skala parametrów (miliardy do bilionów), trening na multimodalnych zbiorach (tekst, kod, obraz, dźwięk), ogólność zastosowań (jeden model do wielu zadań), dostosowywalność przez fine-tuning lub prompting.

Trzy generacje

Anthropic Technical Report 2024 opisuje ewolucję. Pierwsza generacja (2018-2022): BERT, GPT-3, T5, narrow capabilities. Druga generacja (2022-2024): GPT-4, Claude 2, Gemini 1, multimodal capabilities. Trzecia generacja (2024+): GPT-4o, Claude 3.7 Sonnet, Gemini 2.5 Pro, reasoning capabilities, tool use, agentic behaviors.

Ekonomia foundation models

OpenAI Technical Report Q4 2024 raportuje koszt treningu GPT-4 klasy modelu w przedziale 80-100 milionów dolarów. Llama 3.1 405B (Meta, opublikowany jako open-weights) szacowany na 60-90 milionów. Ta skala kapitałowa oznacza że foundation models są budowane przez 5-10 firm globalnie, reszta firm jest konsumentem.

Dla polskiej firmy enterprise praktyczna konsekwencja: foundation model jest kupowany przez API, nie budowany. Decyzja strategiczna nie brzmi "który model wytrenować", brzmi "których dostawców wybrać i jak uniknąć vendor lock-in".

Open-weights vs proprietary

W 2025 ekosystem rozpadł się na dwa obozy. Proprietary (OpenAI GPT, Anthropic Claude, Google Gemini): wyższa jakość, wyższa cena, niemożność hostowania lokalnie. Open-weights (Meta Llama, Mistral, DeepSeek, Qwen): niższa jakość benchmark, znacznie niższy koszt operacyjny, możliwość deployment on-premise.

Dla firm regulowanych (finansowe, medyczne, prawne) Open-weights stają się standardem, mimo niższej jakości benchmark, bo dane nie opuszczają infrastruktury klienta.

Decyzję który foundation model dla konkretnego use case'u Twojej firmy podejmujemy w ramach AI Readiness Audit.