Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

DataCatalogのLineageの BigQueryインテグレーションがやってきた!!! #53

Open
takegue opened this issue Dec 22, 2022 · 0 comments

Comments

@takegue
Copy link
Owner

takegue commented Dec 22, 2022

https://cloud.google.com/bigquery/docs/release-notes#December_22_2022

先日、 DataCatalogのLineage機能がPreviewになっていたのだが
その機能が BigQuery の UIとして反映されるPublic Previewのリリースが本日入りました.

これは BigQueryで下記のようなテーブルのLineageが確認できるようになる、というものでです。
これはみなが求めていたムネアツの機能のひとつですね!

image

Lineage APIを有効にする

Lineage APIを有効にするには、こちらを参考に

  • Data Lineage API
  • Data Catalog APIs
    を有効にしてください。

https://cloud.google.com/bigquery/docs/data-catalog#enable_data_lineage

Data Catalogの Lineageを確認する

上記 APIを有効にしたタイミングから Data Lineageの構築がはじまると思いますので
Data Catalogの画面から確認しましょう。

僕が試した感じの注意点としては

  • Lineageのデータが有効になるまで 10minちょっとかかる
  • 有効になった時間より、前の時間でジョブのデータは参照されない(ように見えるので)
    適宜クエリを流してやると Lineageが早く確認できる

あたりがあります

今後のBigQueryどうなる...?

Data Catalogの BigQueryインテグレーションは誰もが望んでいた待望の機能だと思います。
そのなかで 近年のデータ基盤の取り組みでもアツい メタデータのなかで、LineageがBigQueryにここまで早く統合されたことは非常に嬉しいことです。

これまでは Data Catalogの機能は 独立していたことは多く
BigQuery → Data Catalog方向のインテグレーションはあっても逆方向は多くありませんでした。
昨年から続いてきた(いろいろ煮え湯飲まされた)BQのフロントUIの刷新の成果が
ようやく実を結んだことが実感できるリリースではないでしょうか?

ここを足掛かりにその他のBigQueryのData Catalog機能がBQコンソールに統合される未来も
そう遠くないのではないかと期待せずにはいられないリリースかなと思います。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant