Caption automatici di immagini con Florence-2 base
Negli anni la mia knowledge base tech personale si è riempita di screenshot: dashboard Grafana di esperimenti, terminal con output di comandi che voglio ricordare,
Negli anni la mia knowledge base tech personale si è riempita di screenshot: dashboard Grafana di esperimenti, terminal con output di comandi che voglio ricordare,
Sul portatile mi sono ritrovato negli anni una cartella ~/Note/ che è cresciuta a forza di Markdown buttati lì in fretta. Appunti di letture, snippet
Whisper mi dà un testo continuo, una sequenza di segmenti temporizzati che sa cosa è stato detto ma non sa chi l’ha detto. Per
Per il 90 percento dell’audio che mi capita di trascrivere, il modello small di Whisper basta e avanza. Poi c’è quell’altro 10
I webinar tecnici su Kubernetes o Postgres sono materiale che riascoltare nei tempi morti non riesco quasi mai, ma che vorrei rileggere come testo per
SambaNova Cloud è il secondo provider OpenAI-compatibile che tengo sempre pronto, quello su cui ripiego quando Groq mi sbatte contro i rate limit. Sui modelli
Mistral 7B è il modello che apro quando ho un task di estrazione strutturata su contenuti che preferisco non far uscire dall’Unione Europea. Mistral
FLUX.1 schnell è il modello di immagini che apro di default per le cover degli articoli del blog e per le illustrazioni di servizio
OpenRouter è il gateway universale OpenAI-compatibile. La forza non è tanto un singolo modello, è la possibilità di puntare a decine di modelli diversi con
Gemini 2.5 Pro è il modello che apro quando devo ragionare su un problema architetturale lungo, con un contesto fatto di molti file e
Gemini 2.5 Flash-Lite è il modello a cui mi rivolgo quando devo tirar fuori del testo da uno screenshot o da una foto storta.
Qwen3 235B servito sugli acceleratori Cerebras è il pezzo che ho aggiunto al toolkit per leggere documentazione lunga senza perdere il filo. Il free tier