Modele AI
Foundation model (model bazowy AI)
Duży model uczenia maszynowego trenowany na ogromnym, zróżnicowanym zbiorze danych, zaprojektowany jako uniwersalny punkt wyjścia do dostosowania pod konkretne zadania. Termin został wprowadzony przez Stanford CRFM w 2021 roku jako kontra do wąskich modeli specjalistycznych. Aktualne foundation models obejmują GPT, Claude, Gemini, Llama, Mistral.
Źródło pierwotne: Stanford CRFM, Anthropic, OpenAI Technical Report 2024
Pojęcie zostało wprowadzone w manifeście "On the Opportunities and Risks of Foundation Models" zespołu Stanford Center for Research on Foundation Models w sierpniu 2021. Autorzy (m.in. Rishi Bommasani, Percy Liang, Dan Jurafsky) argumentowali, że trening modelu raz, użycie wielokrotne dla różnych zadań, zmienia ekonomię AI w sposób porównywalny do wprowadzenia stosu LAMP w hostingu webowym.
Cztery cechy definicyjne
Stanford CRFM Foundation Models Report wymienia: skala parametrów (miliardy do bilionów), trening na multimodalnych zbiorach (tekst, kod, obraz, dźwięk), ogólność zastosowań (jeden model do wielu zadań), dostosowywalność przez fine-tuning lub prompting.
Trzy generacje
Anthropic Technical Report 2024 opisuje ewolucję. Pierwsza generacja (2018-2022): BERT, GPT-3, T5, narrow capabilities. Druga generacja (2022-2024): GPT-4, Claude 2, Gemini 1, multimodal capabilities. Trzecia generacja (2024+): GPT-4o, Claude 3.7 Sonnet, Gemini 2.5 Pro, reasoning capabilities, tool use, agentic behaviors.
Ekonomia foundation models
OpenAI Technical Report Q4 2024 raportuje koszt treningu GPT-4 klasy modelu w przedziale 80-100 milionów dolarów. Llama 3.1 405B (Meta, opublikowany jako open-weights) szacowany na 60-90 milionów. Ta skala kapitałowa oznacza że foundation models są budowane przez 5-10 firm globalnie, reszta firm jest konsumentem.
Dla polskiej firmy enterprise praktyczna konsekwencja: foundation model jest kupowany przez API, nie budowany. Decyzja strategiczna nie brzmi "który model wytrenować", brzmi "których dostawców wybrać i jak uniknąć vendor lock-in".
Open-weights vs proprietary
W 2025 ekosystem rozpadł się na dwa obozy. Proprietary (OpenAI GPT, Anthropic Claude, Google Gemini): wyższa jakość, wyższa cena, niemożność hostowania lokalnie. Open-weights (Meta Llama, Mistral, DeepSeek, Qwen): niższa jakość benchmark, znacznie niższy koszt operacyjny, możliwość deployment on-premise.
Dla firm regulowanych (finansowe, medyczne, prawne) Open-weights stają się standardem, mimo niższej jakości benchmark, bo dane nie opuszczają infrastruktury klienta.
Decyzję który foundation model dla konkretnego use case'u Twojej firmy podejmujemy w ramach AI Readiness Audit.