Oprogramowanie do analizy dużych danych dostarcza wglądu w duże zbiory danych gromadzone z klastrów dużych danych. Narzędzia te pomagają użytkownikom biznesowym przetwarzać trendy, wzorce i anomalie danych oraz syntetyzować informacje w zrozumiałe wizualizacje danych, raporty i pulpity nawigacyjne. Ze względu na nieustrukturyzowany charakter klastrów dużych danych, te rozwiązania analityczne często wymagają języka zapytań do pobrania danych z systemu plików. Niektóre rozwiązania mogą oferować funkcje samoobsługowe, dzięki którym pracownicy nieposiadający wiedzy technicznej mogą tworzyć własne wykresy i grafiki na podstawie dużych zbiorów danych.
Niektóre rozwiązania do analizy dużych danych oferują funkcje oparte na uczeniu maszynowym, takie jak przetwarzanie języka naturalnego, umożliwiające użytkownikowi zapytanie o dane firmy w naturalny sposób. Oprogramowanie do analizy dużych danych jest powszechnie stosowane w firmach korzystających z Hadoopa we współpracy z oprogramowaniem do przetwarzania i dystrybucji dużych danych w celu gromadzenia i przechowywania danych. Ponadto, te produkty zazwyczaj integrują się z oprogramowaniem magazynu danych, centralnym centrum przechowywania zintegrowanych danych firmy.
Oprogramowanie do analizy dużych danych różni się od platform analitycznych tym, że pierwsze skupiają się wyłącznie na manipulacji złożonymi i dużymi klastrami dużych danych w zrozumiałe wizualizacje, podczas gdy drugie są ukierunkowane na szeroki zakres źródeł danych i łączniki. Obie kategorie są wzajemnie wykluczające, a produkty, które skupiają się wyłącznie na przypadkach użycia dużych danych, są kategoryzowane tylko w kategorii analizy dużych danych.
Aby zakwalifikować się do kategorii Analiza dużych danych, produkt musi: