Lorenzo Pastore

Data Scientist & ML Engineer  ·  Probabilistic ML  ·  LLM agentic systems  ·  production AI
Pietrasanta, IT +39 328 16 84 329 chongsu.p@gmail.com linkedin.com/in/lorenzopastore1 github.com/LorenzoPastore lorenzopastore.com

01Profilo

Data Scientist con focus su probabilistic ML e sistemi LLM agentic. Esperienza end-to-end nel portare prodotti AI dalla ricerca alla produzione — dal modello all'infrastruttura dati alla UI. Linea coerente di lavoro su responsible AI (fairness, bias) e su sistemi di memoria probabilistica per agenti LLM.

02Esperienza

Menumal — Siligon srl · Seravezza, IT
12 / 2025 — oggi
Data Scientist
Tomato AI · Italia
03 / 2023 — 11 / 2025
Full-Stack Developer & AI Engineer
Consulenza indipendente · remote
02 / 2019 — oggi
Data analysis & ML per PMI
TRT Trasporti e Territorio · Milano
09 / 2021 — 02 / 2022
Curricular Internship

03Progetti tecnici

vague — Probabilistic Memory for LLM Agents
open source · 2026

Libreria Python per memoria probabilistica di agenti LLM via Gaussian Mixture Models sullo spazio degli embedding. Su LongBench (Claude 3 Haiku): compressione del contesto 2.9–7.3×, F1 paragonabile a dense retrieval, closed-form merge analitico tra agenti senza re-indexing. Integrazione Anthropic SDK e LangGraph.

→ github.com/LorenzoPastore/vague
Adversarial-Fair-Classification
accademico · 2022

Classificazione binaria con adversarial debiasing per massimizzare la p-rule; hyperparameter tuning via SMBO; analisi fairness su gruppi protetti.

→ github.com/LorenzoPastore/Adversarial-Fair-Classification
MSc Thesis — Towards Fair NLP
accademico · 2022

A Framework for Unbiased Word Embedding — framework per la riduzione di bias di genere su word embedding pre-trained.

04Capabilities

ML / DL
PyTorch · scikit-learn · NLP · probabilistic models · Gaussian Mixture Models · embeddings
LLM / Agents
Anthropic SDK · OpenAI API · LangGraph · RAG · evaluation (LongBench, needle-in-haystack)
Data Engineering
Airbyte · dbt · Temporal.io · Splink (record linkage) · Postgres · SQL · pandas
Web / Infra
Next.js · Django · Docker · AWS · Vercel · Railway · Git
Practices
production deployment · data quality & reconciliation · security audit documentation

05Formazione & Lingue

MSc Data Science
Università di Milano-Bicocca · 108 / 110 · 2022
BSc Statistical Sciences
Università di Bologna · 110 cum laude · 2018
Lingue
Italiano (madrelingua) · Inglese (C1, fluent)