Najnowsze trendy AI na Google Cloud Day w Warszawie

Blog. Odkryj świat AI.

Najnowsze trendy AI na Google Cloud Day 2019

jakub-portret

Jakub Bzdęga,
AI/ ML Engineer
4 Kwietnia 2019

Czy wiesz, że… firmy robią użytek z 50% swoich danych ustrukturyzowanych i TYLKO 1% nieustrukturyzowanych?

Ta statystyka zaprezentowana podczas Google Cloud Day w Warszawie uświadomiła mi jak ogromny wolumen danych jest pomijany, a przecież mógłby (a nawet powinien) być wykorzystywany w procesach decyzyjnych.
Dodatkowo na konferencji zwrócono uwagę na inną ważną rzecz. Planując wprowadzenie nowych rozwiązań lub rozszerzanie obecnie istniejących środowisk, organizacje powinny nieustannie zastanawiać się:

  1. Jakie będą moje dane za rok?
  2. Co wtedy z nimi zrobię?

Nie zatrzymywać się na tym co zadowala je teraz. Nieustannie pędzący wyścig technologiczny otwiera wiele dróg, ale też rzuca wyzwanie biznesowi. Dlatego też firmy powinny wybierać systemy, które pozwolą im korzystać z informacji w najłatwiejszy i najwydajniejszy sposób.

W tym artykule chcę podzielić się z wami moimi obserwacjami i opowiedzieć trochę o najnowszych trendach związanych ze sztuczną inteligencją w powiązaniu z rozwiązaniami chmurowymi.

google cloud trends ai

Serverless - brak serwera… brak problemu?

Utrzymanie klasycznej infrastruktury IT jest drogie i czasochłonne. Dodatkowo, korzystanie z własnych serwerów staje się coraz mniej uzasadnione biznesowo. Trend serverless rozwiązuje ten problem. Dzięki przejściu na cloud computing, możemy bezproblemowo wdrażać nowe rozwiązania. Korzystamy wtedy z mocy obliczeniowych tylko kiedy ich potrzebujemy – i za to też płacimy.

Kwestie związane z utrzymaniem zewnętrznych serwerów czy ich dostępnością leżą po stronie dostawcy tego typu usług. Pozwala to zaoszczędzić wiele czasu i problemów związanych z zadbaniem o własną infrastrukturę. Ponadto, serverless i skalowalność przygotowują biznes na największe wyzwania. Za przykład może tu posłużyć Black Friday – dzień, w którym wiele firm decyduje się na spore promocje. Generuje to ogromny ruch i obciążenie na stronach e-commerce.

Dlatego potrzebne jest tu bezawaryjne, skalowalne rozwiązanie.. Jeżeli rozwiązanie to potrafi dodatkowo wykorzystać ogromne możliwości płynące z wykorzystania modeli ML, wówczas sklep może generować jeszcze lepsze wyniki dzięki np. spersonalizowanej ofercie dla klientów.

artificial intelligence google image processing

Integracja kluczem do sukcesu?

Eksperci Google’a twierdzą, że kluczem do jak najlepszego wykorzystania danych jest trzymanie ich w jednym systemie. W rzeczywistości, większość organizacji przechowuje informacje rozrzucone pomiędzy różnymi serwerami firmy. Tak naprawdę jedynie odpowiednio zestawiony komplet danych pozwala nam wyciągnąć trafne wnioski i podejmować dzięki nim strategiczne decyzje. Dlatego też Google umożliwia łatwą integrację swoich baz danych (jak BigTable) z rozwiązaniami opartymi na komercyjnym oprogramowaniu uprzednio zainstalowanych w firmach (jak Tableau).

Gigant technologiczny nieustannie dba o to, aby maksymalnie upraszczać integrację z dowolnymi systemami on-premise. Dzięki temu przenoszenie danych do chmury staje się niezwykle łatwe, np. migracja Hadoopa z wykorzystaniem Cloud Dataproc. Jednak autorskie rozwiązania Google to nie wszystko. Firma pozwala też na integrację z zewnętrznymi bibliotekami i frameworkami. Możemy do nich zaliczyć m.in.:

  • Apache Beam,
  • SciKitLearn,
  • Airflow,
  • Keras – teraz jeszcze lepiej zintegrowany z nowym Tensorflow 2.0.

Dzięki niezwykle prostej integracji z innymi narzędziami, Google Cloud można wprowadzić na dowolnym etapie przetwarza danych:

  • gromadzenia – z takich źródeł jak internet rzeczy,
  • przetwarzania – ETL, data engineering,
  • interpretacji wyników i procesy decyzyjne – machine learning, analityka i business intelligence.
google cloud day warsaw 2019

Edge AI - przyszłość sztucznej inteligencji?

Dane tracą wartość jeśli nie zostaną przeanalizowane dostatecznie szybko. Rozwiązaniem tego problemu okazuje się połączenie edge computing z machine learning/ sztuczną inteligencją.
Edge AI zakłada aplikowanie modeli machine learning bezpośrednio na urządzeniu. W takim wypadku, dane nie wychodzą poza jednostkę, która realizuje określone zadanie (jak np. wykrycie jakiegoś zjawiska czy anomalii) i wysyła metadane już do bazy danych.
Ta technologia podbija rynek w zaskakującym tempie. Według szacunków, do 2020 roku liczba tzw. edge devices wzrośnie do ponad 5 miliardów, a aż 45% informacji będzie przetwarzanych bezpośrednio na urządzeniach a (za raportem IDC).

Google również zdecydowało się zareagować na ten trend. Dlatego też tworzy i rozwija autorskie moduły Edge TPU Module marki Coral. Służą one do wykonywania złożonych obliczeń i aplikowania modeli machine learning bezpośrednio na urządzeniu.
Za wydajność odpowiadają tutaj jednostki TPU (tensor processing unit). Optymalizuje się je tak, aby uzyskać jak największą wydajność modeli aplikowanych z wykorzystaniem biblioteki Tensorflow.
Jednym z głównych powodów przenoszenia AI na urządzenia zbierające dane, jest fakt, że nie zawsze jest sens przechowywać wszystkie dane i przesyłać je do bazy. Nie wszystkie surowe informacje są istotne, a wręcz mogą służyć jedynie do inicjowania jakiegoś konkretnego zdarzenia.
Wystarczy spojrzeć na ogrom danych, które generują urządzenia internetu rzeczy, w zależności od obszaru:

  • Przemysł – do 4 TB na maszynę rocznie,
  • Służba zdrowia – około 1 TB miesięcznie,
  • Transport/ ubezpieczenia – do 25 GB na godzinę,
  • Produkty konsumenckie – około 4GB na dzień na jedną linię produkcyjną.

Tutaj przeczytacie więcej o najnowszych technologiach edge AI – Google Coral i Nvidia Jetson

Jaką bazę danych wybrać?

Kolejnym problemem, z którym boryka się wiele firm jest wybranie odpowiedniej bazy danych. Zróżnicowany wybór na rynku z jednej strony może utrudnić tę decyzję, a z drugiej umożliwić dopasowanie technologii dokładnie do potrzeb projektu.
Na co powinno się zwracać uwagę przy tego typu decyzji? Poniżej znajdziecie przegląd wybranych technologii:

  1. Cloud SQL to cloudowa wersja baz MySQL i PostgresSQL powszechnie stosowanych w wielu firmach. Pozwala na łatwe przejście z rozwiązań on-premise na chmurowe.
  2. Cloud Spanner jest skalowalną bazą relacyjną. Zapewnia wysoką spójność danych. Dzięki temu stanowi świetny silnik dla wielu produktów Google’a, takich jak Google Ads, Google Store czy YouTube.
  3. Cloud Bigtable świetnie sprawdza się przy rozwiązaniach internetu rzeczy. Zapewnia wysoką wydajność, skalowalność wraz ze wzrostem danych i bezpieczeństwo. Świetnie integruje się z BigQuery, Cloud Dataproc, Cloud Dataflow i Tensorflow.

Google Cloud Day - moje wrażenia

Rozwiązania chmurowe to nieustannie rozwijający się trend o coraz większej skali. Coraz więcej firm decyduje się na przejście na chmurę. Nawet jeżeli nie wszystkich, to części swoich danych i/ lub usług.
Trzeba jednak zdawać sobie sprawę z faktu, że rozwiązania oferowane przez Google’a i innych graczy nie są idealne dla wszystkich.
Pamiętajmy, że realne korzyści wynikające z przejścia na chmurę pojawiają się kiedy organizacja efektywnie korzysta z usług serverless i umiejętnie generuje dodatkową wartość za ich pomocą.
+ mały sneak peek – już 9-11 2019 konferencja Google Cloud Next, na której mają być ogłoszone duże zmiany!
Więcej na stronie wydarzenia!

Chcesz wdrożyć sztuczną inteligencję w swojej firmie?