CTOのプロフィール
Policy
データエンジニア 森 広志 の経歴、得意分野についてのページです。
- 技術難易度の高いチャレンジングなニーズに対応する。
- ロジカルシンキングを用いた分かり易い説明。
- プロジェクトメンバーのスキル向上を重視する。
Work Experience
ミッションクリティカルな大規模システム開発を多数経験。
開発メンバー500人規模のプロジェクトでのDBAチームリーダー、開発メンバー100人規模のプロジェクトでのデータ連携基盤リードアーキテクトを担当。
経験年数は約25年以上。
データ基盤 構築プロジェクト
- データ連携基盤構築
- データウェアハウス構築
- 基幹系システムのアプリケーションDBA
- データ仮想化基盤構築
技術コンサルティング
- データ連携基盤導入
- データウェアハウス導入
Areas of Expertise
大量データを扱い複雑で難易度の高い技術領域を専門分野とする。パフォーマンスチューニングや複雑な技術課題の解決を得意とする。
例えば以下のような経験がある。
- 200トランザクション/秒を扱うデータベースの統計情報の設計や実行計画の最適化
- ETLのクラスタ化とマルチスレッド化
- 数百億件を扱うデータウェアハウスのアーキテクチャ設計
- 高可用性が求められるデータ連携基盤のアーキテクチャ設計
下記のとおりデータ基盤の重要技術であるDB、ETLについて高い知見を持つ組織で原理から学んだ。
- 前職の日本IBMでは、RDBについてスキルを習得。※RDBは1970年代にIBMによって作られた。
- 前々職の三菱電機インフォメーションネットワークでは、ETL(Informatica)についてスキルを習得。※Informaticaは2000年頃に三菱電機インフォメーションネットワークによって日本語版製品化が行われ日本での販売が開始された。
Skills
パフォーマンスチューニング
データ連携基盤
- アーキテクチャデザイン
- 設計/構築
データベース
- アーキテクチャデザイン
- 設計/構築
WordPress
- 基盤導入
- サイト制作
Certifications
- ORACLE MASTER Platinum Oracle Database 11g
- データベーススペシャリスト試験(IPA)
- Google Cloud Certified Professional Data Engineer
- AWS Certified Data Analytics – Specialty
- LPIC-3: 304 (Virtualization and High Availability)
- Project Management Professional (PMP)
- TOEIC800
Portfolio
掲示板系WEBサイトの分類機能
掲示板系WEBサイトの投稿をVertex AIで分析してスパム投稿を識別する。また、テーマに無関係な投稿を判別できるように要約する。
使用技術:Python、GCPのBigquery、Vertex AI
掲示板系WEBサイトにはすばらしい情報があるが、スパムやテーマとは無関係の投稿も…
スパルタパーソナルカラー塾WEBサービス
https://github.com/data2coordi/pub_makeup
問診WEBサービス
https://github.com/data2coordi/pub_check_my_color_plugin
AIパーソナルカラー診断アプリ
https://github.com/data2coordi/pub_makeup.git
Bigqueryの大量データ生成スクリプト
Bigqueryは大量データを処理するが性能検証用にテストデータを作成するのは大変である。 そこで、Bigqueryで大量データを生成するSQLを作成した。 SQL一発で作成するので非常に高速。またシンプルなので柔軟にカスタマイズ可能。
使用技術:Bigquery
Bigqueryは大量データを処理するが性能検証用にテストデータを作成するのは大…
Bigqueryの性能検証
Bigqueryの性能を検証しました。 基本的内容に加えて公開されていないようなAdvancedな部分にも踏み込んでいます。 検証環境や検証用のSQLも下記で説明しているのでご活用ください。
使用技術:Bigquery
Bigquery 統計情報のクエリプランへの影響の検証
Bigqueryはどの程度、データ傾向を考慮してクエリプランを決めているのか検証している。
使用技術:Bigquery
https://github.com/data2coordi/pub_bigquery_query_plan_ev
Career History
2022 – 2023:日本IBM(Data Engineer)
データ仮想化基盤構築プロジェクトでDeveloperチームのリーダーを担当
- 特徴:グローバルプロジェクト
- 成果:海外と日本でグローバルにデータを連携するシステムを構築
2017-2022:日本IBM(Database Engineer)
大規模基幹システム刷新プロジェクトでDBAチームリーダーを担当
- 特徴:超大規模プロジェクト。PJメンバーは500人規模
- 成果:統計情報の設計/生成、実行計画最適化、パフォーマンスチューニング、DB論理モデリング、DB物理モデリング
2014-2017:三菱電機インフォメーションネットワーク(Data Engineer)
新規基幹システム構築プロジェクトでデータ連携基盤リードアーキテクトを担当
- 特徴:大規模プロジェクト。PJメンバーは50人〜100人規模
- 成果:データ連携基盤の標準化、クラスタ化。マルチスレッド化による処理時間の改善。
〜2014:三菱電機インフォメーションネットワーク(DWH Engineer)
データ基盤アーキテクトとして、データ基盤の導入支援、データ基盤の構築、パフォーマンスチューニング等を担当