Bella – A pedagógusok és a hallgatók digitális asszisztense
Mi a Bella célja?
A Bella egy kifejezetten magyar nyelvű felhasználásra optimalizált, asztali, Microsoft Windows alá készült alkalmazás, amelynek elsődleges célja, hogy hangfelvételekből (előadásokból, tanórákból, diktafonos jegyzetekből) készítsen pontos, szerkesztett szöveges dokumentumot.
A programot azzal a szándékkal fejlesztettük, hogy levegye a terhet azok válláról, akiknek órákig tartó hanganyagokat kellene kézzel legépelniük. Legyen szó egy visszhangos tanteremben rögzített óráról vagy egy gyorsan felmondott jegyzetről, a Bella képes a beszédet írott szöveggé alakítani, majd azt nyelvtanilag helyes, formázott dokumentummá varázsolni.
Hogyan működik?
A Bella a legmodernebb mesterséges intelligencia technológiákat ötvözi egyetlen, könnyen kezelhető felületen. A működése három fő lépésre bontható:
1. A hanganyag tisztítása és előkészítése
Amikor betöltünk egy hangfájlt (legyen az MP3, WAV vagy telefonos felvétel), a program opcionálisan képes zajszűrést végezni. Egy speciális AI modul (DeepFilterNet) eltávolítja a háttérzajokat, a ventilátor zúgását vagy a terem visszhangját, így a leiratozó motor sokkal tisztább beszédet kap, ami pontosabb végeredményt garantál. A hosszú felvételeket a rendszer intelligensen, a csendes részeknél darabolja fel, hogy ne vágjon félbe mondatokat.
2. Leiratozás (A „Fül”)
A program a Whisper technológiát használja a beszéd felismerésére. Ez a motor képes megérteni a hadaró, halk vagy akcentussal beszélő előadókat is.
Sebesség: Ha a számítógép rendelkezik erős videókártyával (NVIDIA GPU), a program azt használja a villámgyors feldolgozáshoz. Ha nem, automatikusan átvált a processzorra (CPU), így régebbi gépeken is stabilan működik.
A végeredmény egy „nyers leirat”, ami szó szerint tartalmaz mindent, ami elhangzott.
3. AI Lektorálás (Az „Agy”)
A nyers leirat gyakran tartalmazhat dadogást, önismétlést vagy fonetikus hibákat. Itt lép be a Bella „AI Lektor” funkciója. Egy gombnyomással a program átküldi a szöveget egy nagy nyelvi modellnek, amely:
Kijavítja a helyesírási és nyelvtani hibákat.
Eltávolítja a felesleges töltelékszavakat (pl. „ööö”, „hát”).
Formázza a szöveget: Bekezdésekre tagolja, és a témaváltásoknál automatikusan címsorokat (Főcím, Alcím) hoz létre.
Kiemelt funkciók a felhasználó kényelméért
Beépített Okos Lejátszó: A leirat ellenőrzéséhez nem kell külön zenelejátszót nyitni. A Bella lejátszóját használva a felhasználó könnyen szinkronban van a szöveggel, és egy gombnyomással válthat az eredeti és a zajszűrt hang között, hogy ellenőrizze a problémás részeket.
Word (DOCX) Export: A kész, lektorált anyag egy kattintással menthető Word dokumentumként, amely már tartalmazza a formázásokat (címsorok, bekezdések), így azonnal nyomtatható vagy tovább szerkeszthető.
Stabilitás: A program a háttérben (külön folyamatban) végzi a nehéz számításokat, így a felület sosem fagy le, még a legnagyobb modellek használata közben sem.
Összefoglalva: A Bella nem csupán egy diktafon-program, hanem egy komplett szerkesztőasszisztens, amely a nyers hangból kész, publikálható dokumentumot állít elő, rengeteg munkaórát spórolva meg a felhasználónak.
BELLA (Bea Előadás Leirat Alkalmazás)
Verziótörténet – a fontosabb verziók
v1.9.0 (Gold Master) – JELENLEGI
- ARCHITEKTÚRA: Stabil Multiprocessing Motor. A leiratozás és zajszűrés teljesen külön folyamatban fut, így a modellváltáskor a VRAM garantáltan felszabadul. Nincs több összeomlás nagy modellek közötti váltáskor.
- UX: Intelligens folyamatjelző (Progress Bar). Letöltés/Betöltés alatt „pattog” (jelezve az aktivitást), feldolgozás alatt százalékot mutat.
- UX: Pontosabb státuszüzenetek (megkülönbözteti a modell letöltését az internetről és a betöltést a memóriába).
- ÚJ: Mentés után a program rákérdez, hogy megnyissa-e azonnal a kész dokumentumot Word-ben.
- JAVÍTÁS: Autosave mappa szigorúbb takarítása (ténylegesen csak az utolsó 3 fájl marad meg).
v1.8.0 – v1.8.5 (Multiprocessing Engine)
- TECHNOLÓGIA: Átállás a „Főnök-Beosztott” (Multiprocessing) rendszerre a VRAM fragmentáció megoldására.
- JAVÍTÁS: „Log File Lock” hiba javítása (a Worker folyamat nem próbálja írni a logot, így nem akad össze a főprogrammal).
- JAVÍTÁS: „UnboundLocalError” és import hatókör hibák javítása a Workerben.
- ÚJ: „Worker Debugger” – hiba esetén a háttérfolyamat egy
worker_debug.txtfájlba írja a hibaokot. - JAVÍTÁS: Statisztikák (időtartam) visszavezetése a külön szálból.
v1.7.29 (UI Layout & Bugfix)
- JAVÍTÁS: A „total_chunks” változó hiánya miatti leállás javítása.
- UI: Reszponzív elrendezés javítása. Ablak összenyomásakor a bal oldali sáv (Fájlválasztó) nem tűnik el, prioritást élvez.
- UI: A „Gyors útmutató” cím betűméretének növelése (13pt).
v1.7.28 (Open Word Feature)
- ÚJ: DOCX mentés után felugró ablak (Igen/Nem), amely felajánlja a fájl azonnali megnyitását.
- JAVÍTÁS: Memóriakezelési finomhangolások.
v1.7.26 (Memory & Icon Fix)
- JAVÍTÁS: Agresszív VRAM takarítási kísérlet (GC + Empty Cache + Sleep) a modellváltásokhoz.
- JAVÍTÁS: Logolás átállítása ‘append’ módra, hogy összeomlás esetén megmaradjon a hibaüzenet.
- JAVÍTÁS: Ikonok betöltése abszolút útvonallal, hogy a Tálcán is a Bella logó jelenjen meg (ne a Python toll).
v1.7.25 (Logic Fix Edition)
- JAVÍTÁS: A lejátszó gombok most már aktívak maradnak leiratozás után (a temp fájlok nem törlődnek azonnal).
- JAVÍTÁS: A „Zajszűrés Cache” funkció most már működik (nem fut le újra feleslegesen).
- JAVÍTÁS: CPU Fallback logika korrigálva (ha GPU-t választottak, de nincs kártya, helyesen számolja a szálakat).
- OPTIMALIZÁLÁS: Felesleges importok és kódduplikációk eltávolítása.
v1.7.24 (Guide & Cache Edition)
- ÚJ: 4 oszlopos elrendezés, bekerült a „Gyors útmutató” panel.
- ÚJ: Zajszűrés Cache (ha a forrásfájl nem változott, nem szűr újra).
- ÚJ: „Retry Logic” a modell letöltéshez (hálózati hiba esetén újrapróbálkozik).
- JAVÍTÁS: Autosave mappa agresszívabb takarítása (csak az utolsó 3 marad).
v1.7.22 (Stable Cleaner)
- JAVÍTÁS: Megszűnt a program fagyása kilépéskor (Deadlock fix).
- VÁLTOZÁS: Visszatérés a stabilabb, függvény-alapú ablak-elrejtéshez (az osztály-alapú helyett).
- JAVÍTÁS: Biztonságosabb Pygame leállítás és temp mappa törlés.
v1.7.21 (Persistence Fix)
- JAVÍTÁS: A zajszűrt hangfájlok nem törlődnek a folyamat végén, így a lejátszó megtalálja őket.
- JAVÍTÁS: Tálcaikon cache frissítése új AppID-vel.
v1.7.20 (The Final Cut)
- VÁLTOZÁS: Egyszerűsített ikonkeresés (elsődlegesen az EXE mellett keres).
- JAVÍTÁS: „Nukleáris” takarítás kilépéskor (shutil.rmtree).
v1.7.19 (Missing Methods Fix)
- JAVÍTÁS: A v1.7.18 refaktorálása közben elveszett eseménykezelők (on_device_change) pótlása.
v1.7.18 (The Polished Gem)
- ÚJ UI: Gombok a szövegdobozok fölé helyezve.
- ÚJ: „Előző leirat visszaállítása” gomb (Autosave betöltés).
- ÚJ: Indeterminate (pattogó) progress bar AI lektorálás alatt.
- UX: Szebb, krémszínű „Csere” ablak, átnevezett gombok.
- UX: Nagyobb Bella logó és feliratok.
v1.7.17 (Communication & Stability)
- JAVÍTÁS: Symlink tiltása (WinError 1314 javítása letöltéskor).
- JAVÍTÁS: VRAM „zsilipelés” modellváltáskor (memória ürítés).
- UX: Részletesebb státuszüzenetek (Letöltés vs Betöltés, Kicsomagolás, Darabolás).
v1.7.16 (Model Switch Fix)
- JAVÍTÁS: Modellváltáskor a program most már ténylegesen betölti az új modellt (korábban a memóriában maradt a régi).
v1.7.15 (Asyncio Compatibility)
- JAVÍTÁS: A subprocess patch átírása osztály alapúra, hogy a faster-whisper asyncio modulja ne omoljon össze.
v1.7.14 (Silent & Precise)
- JAVÍTÁS: Agresszív ablak-elrejtés (SW_HIDE), a „DOS ablakok” végleges eltüntetése.
- ÚJ: 3 gombos Csere ablak (Csak ezt, Mindet, Mégsem).
- ÚJ: Kijelölés alapú csere logika.
v1.7.13 (Feedback Edition)
- ÚJ: Valós idejű visszajelzés a státuszsorban az eszközválasztásról (pl. „CPU: 20 szál észlelve”).
v1.7.12 (AMD/CPU Fallback Fix)
- JAVÍTÁS: Ha GPU van kiválasztva, de nincs NVIDIA kártya (pl. AMD), a program most már helyesen vált CPU optimalizált módra (nem ragad be default 4 szálon).
v1.7.11 (High Performance Restore)
- JAVÍTÁS: A CPU szálkezelés visszaállítása a v1.7.6 logikájára. A 14600KF processzor újra 95-100%-on dolgozik (18 szálon).
v1.7.x (Köztes verziók)
- Különböző próbálkozások a kód tisztítására és a függőségek (pynvml, psutil) kezelésére.
v1.7.0 (Studio Edition) – NAGY UGRÁS
- ÚJ: DeepFilterNet integráció (Zajos felvételek javítása).
- ÚJ: SmartAudioPlayer osztály (Abszolút időkezelés).
- ÚJ: Lejátszó panel (Váltás Eredeti/Javított hang között, -10mp visszaugrás).
- ÚJ: M4A fájlok automatikus konverziója MP3-ra a lejátszóhoz.
- FIX: Subprocess patch a DeepFilterNet „git” hibájának megkerülésére.
v1.6.3 (Focus & Path Fix)
- JAVÍTÁS: Az alkalmazás indításkor az előtérbe ugrik (Focus Force).
- JAVÍTÁS: Ikon keresés a csomagolt (_MEIPASS) mappában is.
v1.6.2 (Icon Fix)
- JAVÍTÁS: AppUserModelID beállítása, hogy a tálcán a Bella ikon jelenjen meg a Python toll helyett.
- JAVÍTÁS: API kulcs elrejtése a log fájlban.
v1.6.1 (UX Update)
- ÚJ: Pattogó progress bar modell letöltéskor.
- ÚJ: Nagyobb Csere ablak.
- JAVÍTÁS: HuggingFace progress bar letiltása (No console hiba ellen).
v1.6.0 (Player Edition)
- ÚJ: Beépített Pygame audio lejátszó (Play/Pause).
- ÚJ: Keresés és Csere funkció a szövegdobozban.
v1.5.32 (Smart Split)
- ÚJ: „Okos darabolás” (Smart Split) bevezetése. A program csendes részeknél vágja el a hangot, nem a mondat közepén.
- ÚJ: Pydub könyvtár integrálása.
v1.0 – v1.5 (Kezdetek)
- Alap Whisper integráció (faster-whisper).
- Tkinter GUI létrehozása.
- FFmpeg beágyazása.
- OpenRouter AI lektorálás alapjai.
- DOCX mentés.