ITお絵かき修行

3歩歩いても忘れないために

PyConJP2022参加メモ

10/14-15にかけてPyConJP2022に参加しました。今更ですが参加メモです。
2019年に蒲田で参加して以来のオンサイト参加でした。
TOC有明は初めてでしたが、アクセス設備共によかったと思います。今後も有明でいいかも‥?

2022.pycon.jp

1日目

Pythonアスタリスク https://2022.pycon.jp/timetable?id=LPYF7C

Pythonにおける「*」の文法事項の一覧、Tipsの紹介
⇒アンパック演算子、専用|可変長引数 etc
・『5つのLTをくっつけた発表』とのことだったので、こういう発表の仕方もあるのかと参考になった。
・発表資料がGithub Pages。ナウい

実践:日本語文章生成 Transformersライブラリで学ぶ実装の守破離 https://2022.pycon.jp/timetable?id=EEA8FG

日経新聞社における文書生成技術の紹介
 ・本文から見出しを自動生成するBERTモデルの構築
  例:画像参照。 本文から見出しを生成する様子。本文中に「諮問」というワードはないが、自動生成されている。

・huggingface社のTransformersライブラリ(自然言語処理)を利用
O'Reilly Japan - 機械学習エンジニアのためのTransformers
・streamlitを使ってpandas.DataFrameをWebアプリとしてホストできる仕組みを利用
Streamlit • The fastest way to build and share data apps
⇒試しに使ってみましたが非常に便利でした。色々制約はありますが、大抵のことはstreamlitで用足りる気がします。

2日目

基調講演: 西内 啓氏 https://2022.pycon.jp/timetable?id=HFEB37

・データサイエンスをすべての人に
 ・DataVehicle社を立ちあげ、dataDiverを作った
 ・dataDiverは、BIツールではなく「拡張アナリティクス」。人間のデータ分析の営みを拡張することが目的
 ・「拡張アナリティクス」という分野での国際シェア1位はDataRobot。国内シェア1位はdataDiver。
 ・dataDiverは仮説探索マシン。非線形な分布や変数が爆発しそうな場合はpandasなど
・(※質疑応答の中で)データ分析会社の財産は事業会社とのリレーションと考えている
 ・最近アクセンチュアがAIベンチャーのアルベルトを買収した。
 ⇒コンサル会社の風土などが合わず、社員が辞めていった場合どうなってしまうのかが興味ある、とのこと

Pythonではじめる地理空間情報 https://2022.pycon.jp/timetable?id=PCBGF8

・3D都市空間はデジタルツイン(≠メタバース)。現実世界をコピーした仮想空間
 ・位置情報の要素は「ポイント(点)、ライン(線)、ポリゴン(面)」
 ・地球は丸くない。山、谷があるので表面は凸凹。
・geemapとleafmap(geemapのスピンオフ)はGoogleColab、JupyterNotebook上で動作するオープンソースPythonパッケージ
geemap · PyPI
・現時点では公的機関向けの活用が主。都市のデジタル化の根幹をなす街づくりのためのデータが現在急速に進んでいる。
例:My City Forecast あなたのまちの未来予報
  現状の人口分布・施設配置データをもとに、2015年~2040年に想定される居住地域の環境を可視化するシミュレーションサービス
My City Forecast あなたのまちの未来予報

SQL クエリ解析による E2E データリネージの実現 https://2022.pycon.jp/timetable?id=QRYKXS

・stairlightというデータリネージツールの作者による発表。
stairlight · PyPI
 ・データリネージ:データの系譜を明らかにすること。メタデータの一種
・dbtとの違い:リネージする対象の範囲
 ・dbtはETLにおけるtransform部分を主に対象とするが、stairlightはダッシュボード部分のSQLなども取得できる。範囲の広さが売り。
・内部ではSELECT文を探索するシンプルなつくり。ただし循環参照や探索深度などの課題があるので、各種アルゴリズムを使い解決している

感想

・テーマが多岐に渡っていたのでとても刺激になりました。
・個人的にはstreamlitが目から鱗でした。ちょっと使ってみましたがとてもいいものでした。
 ・動画映えもする模様。
  【超簡単Webアプリ】streamlitでWebアプリを最速で作ってネット公開!〜 プログラミング初心者向け 〜 - YouTube
  【Section1: Streamlitの概要】【Streamlit+Colab】人工知能Webアプリを手軽に公開しよう! -Udemyコースを一部無料公開- #airslab - YouTube
・展示ブースも結構出ていて、コロナ禍を感じさせない雰囲気でした。
 ・PythonEDの吉政さんがガラポン係をされていたのでなんと贅沢な‥と思ってました