Monte Carlo - Edward Weinert

Analiza Danych

Mierzenie poprawności odpowiedzi LLM

2025-07-24 /

Odpowiedź modelu językowego (LLM) jest zawsze obarczone pewną niepewnością, podobnie jak każdej innej głębokiej sieci neuronowej i klasycznych modeli uczenia maszynowego. LLM generując odpowiedź na zapytanie (prompt) dobiera kolejne tokeny, czyli słowa i znaki interpunkcyjne, w oparciu o prawdopodobieństwo ich występowania. Ta niepewność powinna ograniczać nasze zaufanie do wyników działania modeli językowych o ile jesteśmy świadomi jej istnienia. Z drugiej strony w zależności od zastosowania różna jest też nasza tolerancja na błędy LLM’ów. W niniejszym artykule chciałem osiągnąć dwa cele. Pierwszym było porównanie odpowiedzi LMM dla obszarów, które znacząco różnią się zasobem wiedzy, na której uczono model językowy. Drugim celem było porównanie możliwości testów narzędziami offline oraz z użyciem OpenAI,…

dowiedz się więcej

Zobacz również

Fizyka zmienia uczenie maszynowe
2021-09-03

Entropia – pomost pomiędzy fizyką a uczeniem maszynowym
2021-08-12

Kiedy zniknie błoto i ruszą czołgi?
2023-03-14
Analiza Danych

Między eksperymentem a harmonogramem – planowanie projektów AI z PERT i Monte Carlo

2025-06-09 /

Czas dostarczenia projektu IT jest niejednokrotnie jednym z kluczowych czynników sukcesu produktu cyfrowego na rynku, a pracochłonność jest często głównym składnikiem jego kosztu. Dlatego tak ważna jest informacja o prawdopodobnym terminie dostarczenia i potencjalnym koszcie projektu. Nie inaczej jest z projektami AI. W gruncie rzeczy są to projekty IT, tyle że rozszerzone o bardzo istotną część jaką są modele ML/AI. Oczywiście w skład mogą wchodzić także inne prace związane z budową urządzeń, montażem czujników, itd. W niniejszym artykule przyjrzymy się również jak za pomocą języka Python wykonać symulacje Monte Carlo w celu oszacowania czasu realizacji zadań metodą PERT by oszacować czas realizacji projektu oraz jego pracochłonność. Niepewność i złożoność zadań…

dowiedz się więcej

Zobacz również

Kiedy zniknie błoto i ruszą czołgi?
2023-03-14

Narzędzia do automatyzacji eksploracyjnej analizy danych (EDA) w Python
2021-07-14

Mierzenie poprawności odpowiedzi LLM
2025-07-24

Zobacz również

Zobacz również