ソフトウェア製品・サービス

Sisense 大規模データ分析ソリューション

Sisense は、数十億レコードの大量のデータ、複雑なデータセット、異なるソースからのデータを分析して 視覚化することを可能にする、包括的な大規模データ分析ソリューションです。コーディングやスクリプト作成を行うことなく、使い易いユーザーインタフェースでの簡単なドラッグ&ドロップ操作により、ビジネスユーザーが分析実行、レポート作成、データ視覚化を簡単に行うことができるようになります。 Sisense の高性能データベースは、多数の同時ユーザーのアクセスに対応します。Sisense のシングルスタック機能は、ETL(抽出・変換・ロード)、モデリング、ダッシュボード作成、強力な分析機能を備えており、あらゆるスキルレベルのユーザーがソリューションの高度な機能を簡易な方法で利用することを可能にします。

 







 

Sieenseビジネスインテリジェンスの活用領域
  • カスターマーサービス
  • デジタルマーケティング
  • 財務会計
  • 人財マネジメント
  • 製造生産プロセス
  • リテールビジネス/ eコマース
  • セールス&マーケティング
  • ソフトウェアユーザ管理
  • 経営管理
  • サプライチェーンマネジメント
  • オペレーション&ロジスティクス
  • 製薬ライフサイエンスコンプライアンス
  • 医療業務
  • 保険
  • 政府自治体業務

 

Sisenseの優れたテクノロジー

Sisense の ElastiCube データは、フィールドごとにデータを格納する列指向データベース(Columnar Database Management System:CDBMS)に保持されています。各フィールドは、Windowsオペレーティングシステムのページファイルがメモリのダンプとロードに使用するのと同じメカニズムである、メモリマップファイルに個別に格納されます。 ElastiCube を介してクエリが実行されると、クエリで参照されているフィールドのみをメモリにロードします。これは、クエリのパフォーマンスを低下させる主な理由であるハードドライブへの読み取り/書き込みなしで、クエリをメモリ内で実際に完全に処理するための十分なスペースを残します。 使用されなくなったフィールドは、メモリから削除され、消費された領域は解放されます。
 

照会応答時間
デスクトップコンピュータなどの控えめなハードウェア構成でも、数百万行のデータを含むデータセットに対するクエリは数秒で返されます。

実体化にかかる時間
ElastiCube は迅速なクエリ応答を保証するために事前集計やインデックスの作成を必要としません。そのため、ElastiCube の作成時間は、データマートやOLAPデータベースの数分の1の程度になります。

収納スペース
クエリの迅速な応答を保証するために事前集計やインデックスの作成を行う必要はないため、ElastiCube のサイズはデータマートやOLAPデータベースよりも大幅に小さくなります。

高圧縮
この列指向のストレージ戦略により、詳細や正確さを損なうことなく、データを高レベルの圧縮にはるかに適したものにすることができます。これは必要なハードウェアが少ないことを意味します。従来BIシステムの同等サイズのデータベースよりもディスクスペースとRAMが少なくて済みます。

64ビットサポート
ネイティブに64ビット処理をサポートするように作成され設計されているため、システムが常にアドレス指定できるメモリ量が大幅に増加します。 64ビットアーキテクチャでは、事実上無制限の量のデータを扱うことができます。

真のマルチユーザー、マルチアプリケーションアーキテクチャ
ElastiCube はシステムのアプリケーション層と密接に関連していません。これにより、単一の ElastiCube を解放して複数のアプリケーションとユーザーを処理できます。アプリケーションごとにデータモデルを再現する必要がないため、ダッシュボードとレポートの開発と保守にかかる時間を大幅に節約できます。


ジャストインタイム、インメモリ処理
CPUサイクルとRAMスペースはどのコンピュータでも最も重要な2つのリソースであり、ElastiCube はできるだけ効率的かつ迅速に使用するように設計されています。高度なキャッシングアルゴリズムを使用して、データは必要なときにのみメモリにロードされます。このアルゴリズムの一部として、計算量と時間がかかる計算もインテリジェントにキャッシュされ、I / O呼び出しをさらに削減します。

キャッシュ認識アルゴリズム
さらに洗練されたアルゴリズムは、Sisense のパフォーマンスをさらに向上させます。データがいったんメモリにロードされると、主なパフォーマンスボトルネックは、ランダムアクセスに伴うCPUキャッシュミスとなります。 ElastiCube は、独自のキャッシュ対応アルゴリズムを採用することでこれらのエラーを最小限に抑えるように特別に設計されており、Sisense のパフォーマンスをさらに一桁向上させます。

圧縮計算
すべてのDBはディスクスペースとRAMを節約するためにデータを圧縮します。 ElastiCube はこの圧縮データに直接作用するように設計されているため、解凍の必要性が実質的になくなり、ElastiCube のパフォーマンスがさらに向上します。 標準ハードウェアを考慮して設計されています 市場に出回っているほぼすべての新しいコンピュータは、iPhoneやiPadのようなポータブルで さえも、非常に強力なマルチコアプロセッサで構築されており、複数のCPUを1つにまとめています。 ElastiCube はこれらの強力なCPUを利用するように特別に設計されており、標準ハードウェア上で のSisense のパフォーマンスをさらに向上させ、複数のアプリケーションを実行し、複数のユーザー をサポートすることを可能にします。


RAM効率が高い
企業が利用するDBは、確実に急速に成長し続けていきます。 そのため、完全にインメモリのDBを使用していくら効率的な作業を行っても、最終的にはRAM スペースが不足し、システムのアップグレードが必要になってきます。最悪の場合は、ハードウェアプラットフォーム全体の置き換えで、非常に高いコストがかかります。 Sisense社は数年を費やし、標準的なPCハードウェア上でも何十億行ものデータを効率的かつ迅速に処理できる ElastiCube を開発しました。 Sisense の統合分析エンジンは、多種多様なデータソースに 対してあたかもそれらがすべて同じタイプであるかのようにクエリを実行できるので、各物理データソースの個々の特性は重要ではありません。データかインポートされると、Sisense の統合分析エンジンは抽象化されたメタデータレイヤーを作成し、それを使用して、任意の数のデータソースから任意の数のフォーマット で任意の数のテーブルにわたってクエリを作成します。最初にデータベースにデータをロード することなく、常駐データベースソースと外部(ライブ)データベースソースの複合クエリもサポートします。 これらの機能により、非常に複雑なレポート、ダッシュボード、および分析アプリケーションの 作成、実行、および共有を、さまざまなデータソースで、比類のない柔軟性とスピードでユーザーに提供します。


SQL-92標準をサポート
どのような高度なテクノロジーであっても、ユーザーが既存のデータにアクセスできなければ役に立ちません。Sisense には、SQLレイヤーがシステムに組み込まれており、ユーザーは新しいスクリプト言語を学ぶ必要なしに Sisense を外部アプリケーション に統合することができます。

既存のデータソースとのシームレスな統合
Sisense には、ODBC / OleDB準拠のDBにアクセスする機能も組み込まれています。ElastiCube はこれらのデータソースにシームレスに接続するため、 既存のデータに接続するために新しい言語を習得したり、特別なコードを記述したりする必要はありません。 ElastiCube を使用すると、最初からやり直す必要がなくなり、ITの必要性を最小限に抑えながら、 より速く、より簡単に、そしてよりスケーラブルになります。

2010年に発明された In-Chip テクノロジーは、コストとスケーラビリティの問題に取り組み、メモリ内の優れた点すべてを利用します。これは、最新のハードディスク、RAM、およびCPUの最高品質をリアルタイムで効率的に利用することによって可能になります。インメモリと同等またはそれ以上のパフォーマンスを確保しながら、ディスクの最大ストレージ容量にアクセスすることができます。


パフォーマンス
In-Chip は、システムに負担をかけずに多数の同時クエリを実行できます。標準の一般的なハードウェア、特にCPUに既に存在するテクノロジーを最適化することで、より多くのコンピュータや処理能力に飛散することなく、大幅にパフォーマンスが向上します。


CPU使用率
In-Chip は、オペレーティングシステムに頼るのではなく、独自のコードを使用してRAMの使用方法とテクノロジとCPUとの通信方法を最適化します。重要なのは、可能な限りキャッシュを参照することで、同じデータがRAMとCPUの間でコピーされる回数を大幅に削減することです。 これは、分析的なBIの質問に対してカーネルレベルの命令を最適化し、次にすべてのキャッシュレベルにわたってCPUキャッシュサイズの中間結果を最適化することによって行います。結果として得られるクエリパフーマンスは、従来のインメモリシステムよりも10倍優れています。 圧縮された結果セットをキャッシュにロードし、解凍操作をキャッシュに読み書きさせることによって、アプリ ケーションは巨大なメモリフットプリントを作成することなく、高速で実行されます。これによりシステム全体がより効率的になり、余分なRAMを必要とせずにパフォーマンスが向上します。


ストレージ使用率
In-Chip はそのすべてのデータセットをディスクに保存しますが、それから全部をRAMにロードするのではなく、リアルタイムでクエリする必要があるデータの部分だけをスクープアップします。 完了したら、このデータをディスクに解放します。または、使用状況の統計でローカルに保存するのが妥当であると示唆される場合は、クエリを実行している他のユーザーにも使用できます。これはすべて、データを行ではなく列に格納する列指向データベースが可能にしていることで、In-Chip がテーブル全体を調べなくてもディスク上のフィールドを迅速にスキャンできる理由です。 たとえば、10個のフィールドと10,000個の行で構成されるテーブルがある場合、テーブルデータベースで これをスキャンするには100,000個のディスク読み取りが必要になります。列指向データベースはこれを 1万分の1でスキャンできます。つまり、10分の1の時間です。 もう1つの利点は、列指向データベースを使用するとデータを簡単に圧縮できるため、記憶域を節約できる ことです。さらに重要なことに、In-Chipは最初にデータセットを解凍しなくても計算できます。これにより、 RAM要件がさらに削減されます。


並行処理
In-Chip のもう1つの優れた特徴は、SQLベースのクエリエンジンに頼るのではなく、列指向データベースの 言語を話すことです。SQLベースのクエリエンジンは、巨大なデータベースから必要な部分だけを選択するようには最適化されていません。通常、SQLクエリを実行すると、クエリ全体の結果のみが保存されるため、これはまったく同じクエリを再度実行する場合にのみ役立ちます。 一方、列代数を使用してデータベースにクエリを実行すると、このクエリは数千の小さな命令に分割されます。他の誰かが同じ命令のいくつかを含む異なるクエリを同時に作成した場合、それらを再利用することができ、それらを遅くするのではなく、一度にこれらすべての同時クエリのパフォーマンスが向上します。

ソフトウェア製品・サービス・ソリューションの資料ダウンロード、お問合せはこちら

ダウンロード
資料一覧
PAGE TOP