Mi az adattó?

Az adattó egy központi adattár, amely nagy mennyiségű adat betöltését és tárolását teszi lehetővé eredeti formájában. Az adatok ezután feldolgozhatók és felhasználhatók számos elemzési igény alapjaként. A nyílt, méretezhető architektúra miatt az adattó bármilyen típusú adatot képes kezelni bármilyen forrásból, a strukturált (adatbázistábláktól, Excel-munkalapoktól) a félig strukturált (XML-fájlokig, weblapokig) és a strukturálatlan (képekig, hangfájlokig, tweetekig), mindezt a megbízhatóság feláldozása nélkül. Az adatfájlok tárolása jellemzően szakaszos zónákban történik (nyersen, tisztítva és összeválogatva), így a különböző típusú felhasználók az igényeiknek megfelelően használhatják az adatokat a különböző űrlapjaikon. Az adattavak alapvető adatkonzisztenciát biztosítanak különböző alkalmazásokhoz, a big data elemzés, gépi tanulása gépi tanulási, a prediktív elemzések és az intelligens műveletek egyéb formái számára.

Egyszerűbben megfogalmazva, zsákok, amibe mindent beleönthetünk válogatás nélkül és ha megtelik nyitunk egy másik zsákot. Azonban ennek hátránya is van, ha vissza akarjuk kapni az adatokat, kénytelenek vagyunk minden zsákot átnézni amíg meg nem találjuk amit keresünk.

A cimkézett adattó abban tér el ettől, hogy mielőtt beleöntenénk az információt az adattóba, megjelöljük egy cimkével, hogy gyorsan megtaláljuk. A zsákos példánál maradva, minden belepakolt anyagra kötünk egy kötelet, aminek a másik végén lóg egy cimke. Ha meghúzzunk, épp az az adat kerül ki belőle, amit keresünk.
Adattó biztonság? Poszt kvantum titkosítás!

Az adattóban valamennyi állomány az eredeti formájában van eltárolva, így célszerű kiemelkedően erős titkosítást alkalmazni. A jelenlegi titkosítási eljárások matematikai alapúak, amik a mostani eszközökkel gyakorlatilag feltörhetetlenek (a mai gépekkel évmilliárdokig tartana), ám a kvantumszámítógépek megjelenésével ez már nem feltétlenül áll meg. A fejlesztés alatt álló kvantumszámítógépek képesek lesznek ezeket másodpercek alatt feltörni. Persze nem tudhatjuk,hogy ez holnap, vagy öt év múlva következik be, de biztosan meg fog történni (ha már meg nem történt). Ezt felismerve a törvényalkotók már kötelezővé is tették bizonyos szervezeteknek a poszt kvantum titkosítás bevezetését.

A poszt kvantum titkosítás nem csak gyakorlatilag, hanem elvileg is feltörhetetlen. Mindezt ráadásul a keresése sebesség minimalizálása érdekében úgy kell megoldani, hogy ne okozzon számottevő lassulást a rendszer működésében.

A cimkézett adattóban az adatok poszt kvantum eljárással vannak tárolva, így akkor sem visszafejthetőek, ha a titkosítási eljárás publikussá válik. Az alkalmazott megoldás sebességcsökkenés nélkül többszörözhető, így akkor is visszafejthetetlen marad, ha az adatbázis és akár az egyik kulcsszervert is megszerzik az illetéktelenek. A rendszert üzemeltető személy (renszergazda) sem férhet hozzá, viszont, ha bármelyik kulcsszerver megsemmisül, az adatok véglegesen és visszahozhatatlanul elvesznek.
A cimkézett adattó főbb tulajdonságai
  • a tárolt adatok az eredeti formában kerülnek tárolásra, így bármikor felhasználhatóak előre nem látott feladatokra is,
  • korlátlan tárolókapacitás, amint egy adott tároló eléri a 90%-os telítettségt, automatikusan a következőre kapcsol,
  • tetszőleges típusú adatokat képes tárolni (sima szöveg, dokumentum, kép, hang, video) ugyanabban az adattóban,
  • írási sebessége (8 magos szerveren tesztelve) alapesetben megegyezik a hardver írási sebességével, poszt kvantum titkosítás bekapcsolásánál minimális a csökkenés, tömörített tárolásnál 20%-al lassabb,
  • cimkézési maximum 768 petabyte, ebből tetszőleges számú egymástól elkülönített cimkemező hozható létre
  • cimkézési sebessége egy 8 magos szervernél 6,2 Gbyte/óra, ez osztott erőforrások bevonásával növelhető,
  • a keresési idő egymillió elem 120 millió mezője esetén egy elemű keresésnél nem mérhető, két elemű összetett keresésnél kevesebb 1 másodpercnél, három elemű keresésnél 1,2 másodperc, 25 elemú keresésénél 1,7 másodperc
  • képes keresni a feltöltött dokumentumokban, igény szerint akár a szkennelt anyagokban, video, vagy hangfájlokban is,
  • beépített interface adatbányászathoz és gépi tanulás alkalmazáshoz,
Bemutató adattó
  • cimkézett (struktúrált) adattó,
  • a teljes méret 160 Gbyte.
  • az adattó (adatlapok, képek, dokumentumok, videók) poszt kvantum titkosítással van tárolva,
  • 1 millió generált egészségügyi adatlap (nagylabor), 120 millió mező,
  • 300 000 kép,
  • 300 000 dokumentum pdf, docx, xlsx formátumban,
  • 100 000 video,
  • irányítószám szerint megjelenítés térképen abszolút és lakosszám szerinti százalékos értékben,
  • életkor szerinti megjelenítés oszlop-, kör-, vonalas diagram formájában,

Amennyiben bővebb információt szeretne az adattóról, vegye fel a kapcsolatot a lakatos.ivan@adatto.hu mail címen keresztül.
kérem az e-mail címét  
erre fogja a rendszer elküldeni a belépéshez szükséges kódot