Lorenzo Pastore

01Profilo

Data Scientist con focus su probabilistic ML e sistemi LLM agentic. Esperienza end-to-end nel portare prodotti AI dalla ricerca alla produzione — dal modello all'infrastruttura dati alla UI. Linea coerente di lavoro su responsible AI (fairness, bias) e su sistemi di memoria probabilistica per agenti LLM.

02Esperienza

Menumal — Siligon srl · Seravezza, IT

12 / 2025 — oggi

Data Scientist

Disegno e implementazione end-to-end della data platform aziendale: ingestione da fonti eterogenee non strutturate, normalizzazione, controlli di consistenza e qualità del dato, modellistica per analisi cross-source e dashboarding
Stack: Airbyte (ingestion) · dbt (transform) · Temporal.io (orchestration) · Splink (probabilistic record linkage) · Postgres · Docker · Railway · Metabase
Documentazione di production decisions, reconciliation audit e security audit della pipeline

Tomato AI · Italia

03 / 2023 — 11 / 2025

Full-Stack Developer & AI Engineer

Riscrittura completa del prodotto SaaS da legacy PHP a stack moderno Next.js + Django + PostgreSQL, in team da 3. Migrazione in produzione su clienti attivi nel settore hospitality
Sviluppo di moduli AI per revenue management, monitoraggio prezzi fornitori e controllo costi, integrando OpenAI API
Deployment ibrido AWS + Vercel

Consulenza indipendente · remote

02 / 2019 — oggi

Data analysis & ML per PMI

Market research, cluster segmentation, ottimizzazione operativa, modellistica a supporto di business plan

TRT Trasporti e Territorio · Milano

09 / 2021 — 02 / 2022

Curricular Internship

Sviluppo Python di un web scraper per stima dell'offerta di trasporto pubblico in Europa; analisi e report finale

03Progetti tecnici

vague — Probabilistic Memory for LLM Agents

open source · 2026

Libreria Python per memoria probabilistica di agenti LLM via Gaussian Mixture Models sullo spazio degli embedding. Su LongBench (Claude 3 Haiku): compressione del contesto 2.9–7.3×, F1 paragonabile a dense retrieval, closed-form merge analitico tra agenti senza re-indexing. Integrazione Anthropic SDK e LangGraph.

→ github.com/LorenzoPastore/vague

Adversarial-Fair-Classification

accademico · 2022

Classificazione binaria con adversarial debiasing per massimizzare la p-rule; hyperparameter tuning via SMBO; analisi fairness su gruppi protetti.

→ github.com/LorenzoPastore/Adversarial-Fair-Classification

MSc Thesis — Towards Fair NLP

accademico · 2022

A Framework for Unbiased Word Embedding — framework per la riduzione di bias di genere su word embedding pre-trained.

04Capabilities

ML / DL

PyTorch · scikit-learn · NLP · probabilistic models · Gaussian Mixture Models · embeddings

LLM / Agents

Anthropic SDK · OpenAI API · LangGraph · RAG · evaluation (LongBench, needle-in-haystack)

Data Engineering

Airbyte · dbt · Temporal.io · Splink (record linkage) · Postgres · SQL · pandas

Web / Infra

Next.js · Django · Docker · AWS · Vercel · Railway · Git

Practices

production deployment · data quality & reconciliation · security audit documentation

01Profilo

02Esperienza

03Progetti tecnici

04Capabilities

05Formazione & Lingue