Gunosy Tech Blog

iOSDC Japan 2025に参加・登壇してきました

2025-09-25T15:00:00+09:00

こんにちは。 Gunosy で iOS アプリ開発担当の小野です。 2025 年 9 月 19 日から 21 日にかけて開催された、 iOSDC Japan 2025 に iOS チームが参加し、1名が登壇をしました。今回はその内容を簡単にご紹介したいと思います。

iOSDC Japan 2025 とは
トークの紹介
- 小野が気になったトーク
  - 「iPhone のマイナンバーカード」のすべて
  - 【スマホの熱中症対策】ThermalState API 実践活用ガイド
- 吉岡が気になったトーク
  - SwiftUI時代のスクショ保護〜セキュアなViewの作り方〜
登壇
- 末尾再帰なら安心でしょ？って信じてたSwiftコードが落ちた夜(LT)
まとめ

iOSDC Japan 2025 とは

iOSDC Japan 2025 は、iOS の国内最大級のカンファレンスです。2025 年で 10 回目の記念すべき開催となり、9 月 19 日から 21 日の 3 日間にわたって有明セントラルタワーホールで行われました。今回もオフライン会場での開催に加え、ニコニコ生放送を通じたオンライン配信も実施されるハイブリッド形式での開催でした。

今回は 76 個のスピーカーによる技術トークが行われ、オフライン参加者 1587 名、オンライン参加者 253 名に加え、スポンサー 80 名、スピーカー 110 名、スタッフ 70 名と、総勢 2000 名を超える規模での開催となりました。

会場では技術トークだけでなく、Swift コードを書いて戦うガチバトルコンテンツ「Swift コードバトル」も開催されており、コードゴルフの種目で参加者たちが腕を競い合っていました。また、協賛企業の展示ブースでは活発なコミュニケーションが行われており、コードの正誤問題や AI 関連のクイズ、企業紹介などが実施されていました。中には独自にアプリを開発してゲーム感覚で楽しめるクイズを用意している企業もあり、技術への情熱と創意工夫が感じられました。

夕方には参加者にビールが配られ、リラックスした雰囲気で LT（ライトニングトーク）を聞くという、技術カンファレンスならではの楽しい時間も用意されていました。

iosdc.jp

トークの紹介

今回参加したトークの中から、特に印象的だったものをいくつかご紹介します。

小野が気になったトーク

「iPhone のマイナンバーカード」のすべて

マイナンバーカードを iPhone の Apple ウォレットに追加できるようになりました。このトークでは、iPhone のマイナンバーカード導入によってできるようになったことや、使われている技術について詳しく解説されました。

背景技術として、Mobile Driver's Licence（ mDL ）というアメリカの運転免許証を iPhone に導入する技術があります。この技術の特徴は「選択的属性開示」で、例えば「 20 歳以上かどうか」といった限定的な情報のみを相手に提供できることです。データフォーマットには CBOR が採用されており、バイナリ形式でよりコンパクトにデータを表現することで通信コストを削減しています。また、生体認証を通じてユーザーがデータを渡すかどうかを明示的に承諾してから利用される仕組みになっており、プライバシー保護が徹底されています。 mDL の規格を他の身分証でも使えるように汎用化したのが Mobile documents（ mDoc ）で、これらの技術を用いることで、マイナンバーカードを Apple ウォレットに導入できているとのことです。既存の技術が基盤としてマイナンバーカードの導入が実現されていたのは興味深かったです。

マイナンバーカードが Apple ウォレットに導入されたことで、電子証明書機能を活用できるようになりました。Apple ウォレットに格納されたマイナンバーカードに含まれる情報を取得し、本人確認として活用できます。

技術的な詳細として、JPKIPassContents という日本のマイナンバーカード専用クラスが用意されており、これを用いて年齢や性別、住所等を取得できます。ただし、この JPKIPassContents は一般開発者が自由に扱える API ではなく、適切な管理下で運用されているようです。マイナンバーカードの取り扱いに関してセキュリティの高さに関心しました。

また、Apple ウォレットのマイナンバーカードでは、桜のマークがシンボルとして使われており、傾けると色が変わるという視覚的な工夫も施されています。これは偽造対策としての効果があるそうです。Apple ウォレット側の開発者に依頼を行い、このような実装を取り入れてもらったという開発の裏側の話があったり、桜がシンボルとして選ばれた理由の話が面白かったです。普段何気なく使っている機能の背後にある技術的な工夫や配慮の深さに感動し、最新の技術を実感できる貴重な機会でした。

fortee.jp

【スマホの熱中症対策】ThermalState API 実践活用ガイド

このトークでは、iOS デバイスの熱問題とパフォーマンスの関係について詳しく解説されました。夏場に iPhone が熱くなってアプリがカクカクした経験は誰にでもあると思いますが、その背景にある技術的な仕組みを深く知ることができて非常に勉強になりました。

まず印象的だったのは、デバイスが熱くなるとパフォーマンスが落ちる理由が「サーマルスロットリング」というハードウェア保護機能によるものだということです。CPU が過熱しすぎないよう、意図的に処理能力を抑制しているんですね。

iOS では ThermalState という API を使って熱状態を監視できることを初めて知りました。状態は 4 段階に分かれており、Notification Center に登録することで状態変化をリアルタイムで検出できるそうです。

Nominal（正常）
Fair（注意）
Serious（深刻）
Critical（危険）

特に面白かったのは、実際の検証実験の結果でした。熱の要因は内部要因（ CPU やバッテリーの発熱）と外部要因（直射日光など）に分けられるのですが、内部要因だけでは限界があることが分かりました。無限に三角関数を計算させても最大 44 度程度で、Critical 状態にはならなかったそうです。

一方、外部要因の影響は想像以上に大きく、直射日光に当てた場合、わずか 236 秒で Critical 状態に到達し、ディスプレイ面が 52.8 度まで上昇したとのことです。さらに内部要因と外部要因を組み合わせると、90 秒という短時間で Critical 状態になってしまうという結果には驚きました。

実用的な話として、LUUP アプリでの実例も紹介されました。実際のユーザーからログを取得した検証結果です。6 月 2 日（気温 21 度）では特に問題なかったのに対し、8 月 31 日（最高気温 36.8 度）では正午に Nominal が減少し、Critical 状態のユーザーが全体の 8%まで上昇したという具体的なデータが印象的でした。

このトークを通じて、ThermalState に応じてアプリ側の UI を変更したり、ユーザーに求める動作を減らしたりする工夫により、ユーザー体験が大幅に向上する可能性があることを学びました。昨今の気温上昇を考えると、このような熱対策は今後ますます重要になりそうです。特に屋外で使用されるケースが多いアプリでは、この ThermalState API を積極的に活用していきたいと思いました。

fortee.jp

吉岡が気になったトーク

SwiftUI時代のスクショ保護〜セキュアなViewの作り方〜

このトークでは、UIKit を「ハック」することで、通常の実装では実現できない機能を可能にする技術が紹介されていました。

スクリーンショットから情報を保護する機能を直接実装する予定はないものの、限られた仕組みを組み合わせて、画面に任意の情報を表示させたり、逆に表示を隠したりするテクニックが解説されており、エンジニアとして強く知的好奇心を刺激されました。

こうした知識は、別の場面でも応用できる可能性があり、エンジニアとしての「引き出し」を増やすうえでとても有益だと感じました。

fortee.jp

登壇

Gunosy からは吉岡が登壇しました。

末尾再帰なら安心でしょ？って信じてたSwiftコードが落ちた夜(LT)

Swift における「末尾再帰」についてお話しました。 Swift でも末尾再帰の最適化は行われますが、コードを見ただけでは最適化が効いているかどうかを判別するのは難しい、という点を紹介しつつ、再帰を使うことへの考え方について考察しました。

日常的にコードを書いていると、コンパイラによる最適化を意識する機会は多くありません。今回の登壇が、その最適化を改めて意識し直すきっかけになったのであれば、とても嬉しく思います。

fortee.jp

まとめ

今回初めての iOSDC Japan 2025 参加となりましたが、3 日間を通じて非常に充実した時間を過ごすことができました。企業ブースでは、各社が使っている技術スタックやサービスの特徴について幅広く知ることができました。普段接することのない企業の取り組みを知ることで、iOS 開発の可能性の広がりを感じることができました。懇親会では他社の iOS エンジニアの方々と直接お話しする機会もあり、それぞれの開発現場での課題や工夫について情報交換できたのがとても楽しかったです。iOS コミュニティの活発さと技術への熱意を肌で感じることができ、とても良い刺激となりました。 iOSDC Japan 2025 で関わっていただいたすべての皆様、素晴らしいカンファレンスをありがとうございました！

DroidKaigi 2025 に参加してきました

2025-09-17T14:00:00+09:00

こんにちは。Android アプリ開発担当の plusnine と nagayama（@nagayan_dev）です。 2025 年 9 月 10 日から 12 日にかけて開催された、 DroidKaigi 2025 に参加してきました。今回はその内容を簡単にご紹介したいと思います。

DroidKaigi 2025 とは
ワークショップ
セッションの紹介
まとめ

DroidKaigi 2025 とは

DroidKaigi とは、Android の技術の共有とコミュニケーションを目的としたカンファレンスです。今年で 11 年を迎えました。

2025.droidkaigi.jp

昨年に続き渋谷ガーデンタワーで開催されました。初日の 10 日は Compose Multiplatform のワークショップが開催され、11 日と 12 日はセッションが行われました。

今年のセッションは 5 つの会場で 48 のセッションが行われました。全て 40 分で行われ、1 つのテーマに対して深く話を聞くことができました。

今年も昨年に続き、協賛企業の展示ブースでは活発なコミュニケーションが見られました。昨年までは「コードの正誤を判定する」といったクイズが多い印象でしたが、今年は「生成AIで作成されたコードはどれか」「このレイアウトを作成するプロンプトを書いてみよう」といった、AIに関連したクイズを出すブースが目立ちました。

参加証となる名札は事前に郵送されました。登録した名前とアイコンが印刷された名札に、デコレーション用のシールが同封されており、当日はそれを自由に貼ってアレンジし、首からかけて参加するスタイルでした。

また、毎年恒例となっているスタンプラリーも開催されました。協賛企業の展示ブースを回ってスタンプをもらうことで、その個数に応じて景品がもらえるというものになります。景品は最大 3 つ受け取ることができ、私はタンブラーとポーチ、子供用Tシャツを受け取りました。

ワークショップ

DroidKaigi 初日のワークショップでは、JetBrains 社から講師をお招きし、Kotlin Multiplatform と Compose Multiplatform を使ったクロスプラットフォームアプリ開発を学びました。ワークショップでは、まず Kotlin Multiplatform アプリの基本的な構成から始まり、Android・iOS・デスクトップといった各プラットフォームでの実装分岐の方法を丁寧に解説していただきました。これにより、Kotlin Multiplatform を初めて触る人でも開発を始められるノウハウが得られました。さらに、Compose Multiplatform を使うことで、各プラットフォーム固有の UI 実装知識がなくても、普段の Android 開発と同じ感覚で UI を構築できる点がとても印象的でした。データ保存など一部プラットフォームごとの実装は必要ですが、アプリ開発の大部分は共通コードでカバーでき、1つのコードベースから複数のプラットフォームに対応できるのは非常に革新的です。これまで各プラットフォームごとに個別実装していた手間を考えると、まさに新しい時代の開発スタイルだと実感しました。とても刺激的で貴重な体験に、心から感謝しています。

セッションの紹介

参加したセッションの中から一部をご紹介します。

① はじめてのMaterial3 Expressive

Material3 Expressive は、2025 年 5 月に Google が発表した新しいデザインシステムです。「表現力豊かで、より感情に訴えかける UX」を目指しており、感情に響くモーションや、ユーザビリティ・アクセシビリティの向上が大きな特徴です。今回のセッションでは、Material3 Expressive の実装方法の紹介から始まり、既存プロダクトへの導入時に考慮すべき懸念点や注意点についても詳しく解説されていました。

個人的に一番驚いたのは、「表現力豊か」な UI を非常にシンプルな実装で再現できる点です。これまで Jetpack Compose ではコンポーネントが限られており、凝ったレイアウトやアニメーションは独自実装が必要でした。特に、Floating Action Button から表示されるメニューは、レイアウト作成に加えてアニメーションの実装まで行う必要があり、大きな負担となっていました。しかし Material3 Expressive では、アニメーション込みのコンポーネントが用意されており、インターフェースに要素を追加するだけで簡単に実装できます。もちろん導入にあたってはデメリットもありますが、適用可能な場面では積極的に取り入れていきたいと感じました。

2025.droidkaigi.jp

② Androidライブラリアンの手引き：堅牢なライブラリとSDKの構築

堅牢、かつメンテナンスしやすいAndroidライブラリの構築と運用についてのセッションです。スピーカーの方（skydovesさん）が、実際の経験を通して得られた教訓をベースにしているとのことです。

セッション内容については、

Visibility Modifier（可視性修飾子）について
APIのライフサイクル（統廃合等）について
@Deprecatedを用いたpublic API段階廃止のルール例
バイナリ互換性(Binary Compatibility)について
Rクラスの名前衝突を避ける方法（Resource prefix等）
推移的依存関係について

…等、実践的な知識・テクニック要素が色々ありました。

私自身も社内向けに内製ライブラリの実装・メンテナンスをしているため、これまで何となくで理解していた部分のおさらいや、すぐ取り入れられそうな手法など参考になる点が多かったです。特にルール・ドキュメンテーションに関わるものは雰囲気で運用されがちなので、これを機にちゃんと整備・見直しをかける習慣を構築していきたいと思います。

2025.droidkaigi.jp

動画

③ スマホ新法って何？ 12 月施行？アプリビジネスに影響あるの？

こちら、12 月 18 日施行を控えた「スマホ新法」についてのセッションです。若干エンジニアリングとは毛色が違いますが、こういった類のセッションは珍しい気がするので紹介です。公正取引委員会官房参事官の方（鈴木さん）が、過去の経緯 ( 7 年程前から検討を続けてきたとのこと ) も交えつつ、その具体的な内容・既存ビジネスが受ける影響について解説されていました。

※ 詳細な指針等の成案についてはこちらのページを参照。

サービス・プロダクトと関わっていくうえで、エンジニアにとって開発はもちろんビジネス的な観点も大事です。ただそういった中で意外と考慮から漏れがちな法律周りのアップデートについて、改めて考える良い機会となりました。

2025.droidkaigi.jp

動画

まとめ

今年も DroidKaigi 2025 に参加しました。年々パワーアップしていくイベントで、今年も AI や Multiplatform といったホットなトレンドを存分に感じることができました。セッションやワークショップで熱い知見を届けてくださった登壇者の皆さま、そして最高の場を作り上げてくださった DroidKaigi スタッフの皆さまに、心からの感謝をお伝えします。

AWS Summit Japan 2025 に参加してきました

2025-08-01T12:00:00+09:00

こんにちは、koizumi です。今回は幕張メッセにて開催されました AWS Summit Japan 2025 の参加レポートになります。

AWS Summit Japan 2025
気になったセッションのご紹介
終わりに

AWS Summit Japan 2025

今年は 6/25 と 6/26 の 2 日間で開催され、私は初日はオンライン参加、2 日目は現地参加してきました。アーカイブも公開されておりますので、気になる方は下記リンクからご覧になってください。

aws.amazon.com

気になったセッションのご紹介

今年の AWS Summit で、特に印象に残ったトピックの一部についてご紹介できればと思います。

サービス停止を防ぐコンテナ活用術: コンテナワークロードにおける高可用性設計の実践

紹介者：koizumi

本セッションでは、マイクロサービスアーキテクチャなどのようなコンテナ技術を活用した複雑なワークロードにおいて、可用性を確保するためのアーキテクチャ設計のポイントについて取り上げていました。

高可用性を実現する上での設計のポイントとして、以下のような点が挙げられていました。

冗長化する
- Pod を複数用意する etc
- 配置戦略がポイント
  - インスタンス、リージョン単位で分離して配置する etc
  - マルチ AZ に分散配置する
    - Pod 単位の AZ 分散配置（PTSC (pod topology spread constraints)）
      - Descheduler etc
    - インスタンス単位の AZ 分散配置
      - Managed Node Group / Cluster Autoscaler
      - Karpenter / Auto Mode はデフォルトで分散配置
    - AZ 障害が他の AZ のリソースに伝搬する可能性がある
通信の信頼性を高める
- 高速な切り離し：ヘルスチェック
- 呼び出し先のヘルスチェックをして、早期に切り離す
  - コンテナのヘルスチェック：Liveness Probe で対応可能
  - Service Discovery のヘルスチェック: Readiness Probe で対応可能
  - ロードバランサーのヘルスチェック: ターゲットグループへのヘルスチェックでルーティング対象から外すなどで対応可能
    - デフォルト 30s * 5 なので、この値をチューニングするのも大事
- サーキットブレーカー
  - 実装例としては Istio などで対応可能（Cilium も可能）
  - Istio でもサーキットブレークの設定は可能
- リトライやタイムアウトの設定

また、早期に障害範囲を切り離すことで復旧速度（MTTR）を早める対応パターンについても非常に参考になりました。

大枠 2 つの対応パターンがある
- AZ 独立性：障害分離境界により範囲障害の影響を軽減する
  - トラフィックを AZ 内に閉じることで障害を分離する
  - EKS だと、Topology Aware Routing, trafficDistribution を使うことでベストエフォートで AZ 内に閉じることができる
  - ELB ではクロスゾーン負荷分散無効化が可能
  - AZ 毎の DB 接続点は Cloud Map で設定する必要がある
- AZ 退避：早期に障害範囲を切り離す
  - 静的安定性を考慮した退避が重要
  - 分散されたデータプレーンにてフェールオーバをする
  - Application Recovery Controller のゾーンシフト
    - これ気になる
  - どうやって AZ 退避をキックするのか
    - システムメトリクスから、特定 AZ での障害を検知する
    - AWS が提供するイベント（Service Health Event とか）
デメリットとしては、設計が複雑化してしまう
- 重要な高可用性目標を持つコンポーネントやパスへの適用を検討する

Kubernetes などの複雑なワークロードを利用されている方には非常に参考になるセッションでした。気になる方はオンラインでも視聴できるので、是非ご覧になってみてください。

AWS による生成 AI のセキュリティアプローチ

紹介者：mtjune

本セッションでは AWS が生成 AI に関するセキュリティにどのようなアプローチを採っているのか、ということについて大きく3つのレイヤーに分けて紹介を行っていました。

生成 AI モデルの構築・学習のための基盤レイヤーのセキュリティについて
- AWS オペレーターが AWS 利用者のデータに触れないようになっている
  - Nitro System と呼ばれる基盤によって AWS オペレーターから AWS 利用者のデータを完全に分離
- AWS 利用者から、個人情報など機密性の高い情報に触れないようにする
  - Nitro Enclaves によって、インスタンス内に隔離された環境を作ることができる
生成 AI アプリケーション構築のためのツールレイヤー(Amazon Bedrock など)のセキュリティについて
- モデルプロバイダが行うモデルの学習に AWS 利用者のデータが使用されないことを保証している
  - モデルが推論を行うアカウント(AWS 管理)と、モデルの学習を行うアカウント(モデルプロバイダ管理)を分離することで実現
- データ・モデル・出力へのアクセスを制限する
  - IAM などのサービスを利用することで、必要最小限のポリシーをつけるようにする
  - ユーザーのリクエストに応じて AI エージェントがナレッジベースや各種ツールにアクセスする時点で認可を行い、本来触れないデータにエージェントがアクセスできないようにする
    - AI エージェント自体が、データなどのアクセスに関わるセキュリティ上の判断を行うべきではない
      - 従来の決定論的なセキュリティを用いることで、リスクが予測できるようになる
- 生成 AI の安全性の実現に Amazon Bedrock Guardrails が有用
  - 有害コンテンツの生成や不適切な質問をブロックしたり、機密情報の除去、ハルシネーションのフィルタリングなどが可能
生成 AI アプリケーションレイヤー(Amazon Q など)のセキュリティについて
- Amazon Q Business のセキュリティ
  - 管理者がガードレールを設定可能
    - 有害な応答をフィルタリング
    - 応答を企業内コンテンツに制限
      - 高い関連性の応答や、ハルシネーションの抑制につながる
  - AWS PrivateLink によって Q Business へのセキュアなアクセスが可能
  - IAM Identity Center を用いてユーザーの権限に基づいたアクセス制御も可能
  - 入力データは学習に利用されない

生成 AI のセキュリティに対して AWS がどのようにアプローチしているのか、普段は見れない AWS サービスの裏側を知ることができる非常に面白いセッションでした。セッションで紹介されていた Nitro System は基調セッションでも紹介されており、AWS 的にも特に注力しているように感じました(ブースでは Nitro Card の展示もされていました)。

展示されていた Nitro Card

セキュアなソフトウェア開発ライフサイクルのための生成 AI

紹介者：k.oshiro

できるだけ開発の初めの方でセキュリティ対策を入れることが重要（シフトレフト）
- 開発の後半からセキュリティを考えるのではなく、初めの方からセキュリティを意識する
  - Amazon Q Developer などで設計からセキュリティ対策を入れる
コード全体のセキュリティはどうするか？
- ソース管理システムに渡した後も Amazon CodeGuru Security, Amazon Inspector などでチェック
- コードの安全性、コードが依存しているライブラリの安全性を静的構成分析を行う
本番環境ではどうするのか？
- デプロイ後にもコードやパッケージが脆弱になっている可能性もある
  - Amazon Inspector を使って継続的にチェック可能
AWS からの開発者サポート
- Amazon Q Developer がどのように開発をサポートするか
- コード作成
  - Amazon Q Developer が開発環境のコンテキストを読んで、README などのドキュメントの整備を行える
  - 開発ももちろん可能
- レビューの実施
  - IDE (Visual Studio Code) からも Amazon Q Developer でのコードレビューが可能
    - 重要度などの情報が一覧でき、より詳しい内容も確認可能（リスクや修正方法など）
    - コードの修正案まで提案可能
  - GitHub などでも使用可能
- CI/CDパイプラインでのセキュリティの担保
  - Amazon CodeGuru Security が使用できる
  - CI/CD などのパイプライン上では CLI/SDK で呼び出せる
  - Amazon Inspector で統合的にコードの脆弱性を検出できる
- デプロイ後の継続的な監視
  - Amazon Inspector
    - デプロイ後も脆弱性を継続的にスキャンすることができる
    - ソフトウェア部品表（SBOM: Software Bill Of Materials）を作成できる
      - SBOM は S3 に吐き出されるので、Athena などで読み込めばクエリが可能
        
        特定のライブラリに脆弱性があった際に、どのサービスに影響があるかをすぐに調査できる
    - EC2, ECR などの脆弱性スキャンを強化できる

セキュアなソフトウェア開発を行うために生成 AI をいつ、どのように活用するか学べるセッションでした。このセッションで紹介された手法は、さまざまな AI Agent を使って取り組むことができる汎用的な内容だと感じました。一方で、Amazon Q Developer は AWS アカウントのコンテキストを考慮できるということで、ぜひ使ってみたいと感じました。

終わりに

今回の AWS Summit Japan 2025 では、クラウドネイティブアーキテクチャから生成 AI のセキュリティまで、幅広い技術領域における最新の取り組みやベストプラクティスを学ぶことができました。

また、土砂降りになるなど悪天候の中でしたが、いくつかのセッションでは立ち見が発生するほど盛り上がっており、関心の高さを肌で感じることができました。他にも、展示ブースでは Nitro Card の実物を見ることができ、AWS のインフラを支える技術を知ることができました。

ここで得た学びや知見を、今後の開発・運用業務にぜひ活かしていきたいと思います。

NLP2025 参加報告

2025-04-28T15:00:00+09:00

こんにちは、データサイエンス部の森田、大城、新規事業開発室の井口です。

もう気がつけば開催から一月経ってしまいましたが、今回の記事は 3/10 ~ 3/14 の 5 日間にわたって開催された言語処理学会第 31 回年次大会 (NLP2025) の参加レポートになります。

スポンサーしてます

NLP2025 について
論文紹介
まとめ

NLP2025 について

言語処理学会は人工知能の一分野である（自然）言語処理を専門とする学会です。近年は特に LLM の話題が多く、参加者の幅も広がっているようです。

昨年に引き続きオフライン・オンラインのハイブリッド開催となり、長崎市の出島メッセ長崎が会場でした。九州での現地開催は第4回の九州大以来となります（第２７回は北九州国際会議場ではあるもののオンラインのみ）。

参加者数は 2,248 人（6% 増）、発表件数は 777 件（29% 増）、スポンサー数は 103 団体（15% 増）といずれも過去最多を更新し、会場は大いに賑わっていました。 Gunosy もシルバースポンサーとして参加しています。

参加者の活気や熱も高く、 Youtube で動画が公開されているチュートリアルや招待講演をみると会場の雰囲気がわかります。どのチュートリアルも興味深いですが、特にチュートリアル１の「言語モデルの内部機序の解析と解釈」は現在の到達点がわかる非常に良質なチュートリアルになっています。

www.youtube.com

論文紹介

発表件数が大幅に増え、今年から開始が 8:30 に早まるなど、どの発表を見に行くか迷った方も多いのではないかと思います。以下では、Gunosy のメンバーの視点から特に印象に残った論文・発表の紹介をしていきたいと思います。見逃していた発表を見返す機会となれば幸いです。

[P8-15] 逆プロンプトを用いたコールドスタート推薦

著者：草野元紀 (日本電気株式会社)
リンク: pdf
紹介者：大城
概要
- インタラクションが少ないユーザーに対しての推薦であるコールドスタート推薦に LLM を用いる研究では、LLM に対して「このユーザーがこのアイテムを好むか」推論させますが、この手法ではスループットが犠牲になります。
- この研究では、LLM への質問形式を逆転させ「このユーザーはどのようなアイテムを好むか」という質問で 好みそうなアイテム の擬似サンプルを得ることで学習データを拡張し、推論時には従来の推薦手法を用いることで、運用時の問題に対処しています。
所感
- 実際の業務でも、LLM を用いた推薦はやはり金銭的な面やスループットなどが懸念されると思います。この研究の提案手法では、 LLM の知識を推薦に取り入れつつも、スループットが犠牲にならないように学習時のデータ拡張器としてのみ LLM を利用するという実践的なもので、とても興味深い研究だと感じました。

[A2-1] 大規模言語モデルにおける複数の指示追従成功率を個々の指示追従成功率から推定する

著者：原田憲旺 (東大), 山崎友大 (京大), 谷口仁慈 (琉大), 小島武, 岩澤有祐, 松尾豊 (東大)
リンク: pdf
紹介者：井口
概要
- 大規模言語モデルが複数の指示に同時に従う性能を検証するため、新たなベンチマーク「ManyIFEval」と「StyleMBPP」を作成。その結果、複数の指示を同時に成功させる確率は、個々の指示の成功率の積でおおよそ推定できる、という経験則が見出されました。この発見は、未知の指示の組み合わせに対する性能予測を可能にし、また指示数が増えると成功率が急激に低下するという重要な示唆を与えます。
所感
- 複数の指示に対するLLMの成功率が、個々の成功率の単純な掛け算で推定できるという経験則は、非常に興味深く実用的です。この知見は、AIに複雑な要求をする際の限界を理解し、プロンプト設計を改善する上で重要な手がかりとなりそうです。

[A5-4] プロンプトに基づくテキスト埋め込みのタスクによる冗長性の違い

著者：塚越駿, 笹野遼平 (名大)
リンク: pdf
紹介者：森田
概要
- プロンプトに基づくテキスト埋め込みというのは、「レビューのP/N 分類」や「クラスタリング」、「検索」などタスクごとにプロンプトを与えてテキストの埋め込みをつくるタスクです。タスクごとに必要となる情報は異なり、どんなタスクにも使える最強のテキスト埋め込みを作るのは非常に難しいので、一つのモデルで様々なタスク向けの埋め込みを生成できるようになるのはありがたいです。
- さて、この研究ではタスクごとに必要な情報が異なることにより、生成されるベクトルの性質が違うことに注目していて、各タスク向けに生成した埋め込みの分析と、情報のロス無くどの程度まで埋め込みの次元を削減できるかを調べています。
所感
- LLM系のモデルで生成する埋め込みはサイズが大きいので次元削減の効果・実用性も高く、埋め込みの固有次元や異方性を調べる分析方法やその結果も面白かったので個人的には賞を送りたい研究のひとつでした。

まとめ

今回の記事では、言語処理学会第 31 回年次大会 (NLP2025) の参加レポートをお届けしました。

やはり LLM を扱った多様な研究が目を引きました、実用例の紹介から内部動作の検証まで幅広く、企業からの参加者として非常に有意義でした。来年の NLP2026 は宇都宮での開催ということで、現地にてまた多くの方にお会いできることを楽しみにしています。

「IR Hub」のロゴデザインができるまで

2025-04-21T08:30:00+09:00

こんにちは！新規事業開発室にてデザイナーをやっているitoです！この記事では先日Gunosyからリリースされた適時開示プラットフォーム「IR Hub」のロゴデザインができるまでの経緯を簡単に共有できればと思います。

IR Hubとは？

IR Hubとは、あらゆる情報開示⁨⁩に関するIR業務を一元化し、プロジェクトの管理から調査、執筆、レビュー、公開までワンストップでサポートすることで、手間と属人化から解放し、企業の価値を伝える本質的なIR活動に導いていくサービスです

詳しくはIR Hubのサービスサイトをご覧ください irhub.jp

1. サービスコンセプト/ターゲット

Gunosyには「情報を世界中の人に最適に届ける」というMissionがあり、この「IR Hub」でも開示業務の手間と属人化から解放し、株式市場に情報を最適に届ける助けとなることを目的としています

開示業務では下記のような課題を抱えるIR担当者や管理者がいます。

適時開示の要否判断
執筆の難易度
資料の英訳化
参考事例の検索性の低さ
業務の属人化による、安定運営のリスク

「IR Hub」は、開示業務を一元管理することで上記の課題解決を目指しています。

2. デザインキーワードの設定

サービスのコンセプトやターゲットなどからサービスらしさを表現していく中で指針となる、デザインキーワードを三つ設定しました。

Trust（信頼）
Refine（洗練）
Easy（簡単/楽）

このキーワードを意識しながら、サービス全体のデザインを進行していきます。

3. サービスロゴ

当初は「IR Hub」というサービス名の他に「TRUST IR」というサービス名も候補として残っていました。サービス名やコンセプト、業務内容などからロゴのモチーフになりうるキーワードを連想していきます

「広がり」「開く」「公開」「示す」「発見」「連携」「整理」「ステップ」「つながる」「人と人」「会社と株主」「情報発信」「情報を提供」「拠点」「中心」「中央」「中枢」「信用」「保護」「責任」「委託」「頼り」など

1st アイデア

まず連想されたキーワードからマークを作成し、多くのアイデアを発散します。形に込めたコンセプトの考え方やどのような形がサービスらしさを感じるのかチームメンバーにも意見をもらい、ざっくりと方向性を絞ります

2nd アイデア

絞られた方向性からどうゆう思いをロゴに込めるか、独自性を感じる形を表現できないかを考え、形の検証も進めていきます。

3rd アイデア

さらに絞られた方向性から少しだけアイデアを膨らませます。カラーをつけて、キービジュアルやプロダクトなどロゴが展開されるイメージも作成し、ロゴの利用しやすさやサービスとの相性も検証します。

FIX

最終的に「さまざまな情報（=形）を集約して、整理する」という意味が込められたこちらのマークが選ばれました。チーム内では洗練された形やマーク単体での存在感などが評価されていました。

4. カラー選定

開示業務は、多くの企業情報を取り扱う業務になるため、そんなシーンでも利用しやすさや洗練さを感じつつ、ストレスに感じない色をサービスのブランドカラーとして選びました。

ブランドカラーからカラーパレットも作成していきます

下記サイトで作成 m2.material.io

5. 完成

選定したカラーをロゴに反映して、ロゴタイプやスペーシングの調整し、完成したのがこちらになります。マーク内にある４つの図形をエレメントとして、アイコンも制作しました。

6. 最後に

サービスに関わるデザインはロゴだけではなく、UI、サービスサイト、営業資料など多岐にわたるので、初期にデザイン設計を少しでもやると、サービスの世界観を崩さない運用ができるのでよかったです。

これから「IR Hub」が多くの企業やユーザーの課題を解決できるサービスになれるように引き続き頑張っていきます！ありがとうございました！

try! Swift Tokyo 2025に行ってきました

2025-04-16T12:30:00+09:00

こんにちは。 Gunosy で iOS アプリ開発している小野です。 try! Swift Tokyo 2025に参加してきたのでレポートを書きます。

はじめに
try! Swift の雰囲気
小野が気になったトーク
- Swift × Android: Skipが切り拓くクロスプラットフォーム開発の未来 by yamaken
plusnineが気になったトーク
- Swiftコード生成の可能性を解き放て by rockname
吉岡が気になったトーク
- SwiftUI Textを使った特殊効果 by Paul Hudson
try! Swift を通して得たもの
イベントを終えて

はじめに

try! Swift Tokyo は Swift をはじめとする iOS アプリ開発などを取り扱う技術カンファレンスです。今回は立川ステージガーデンにて 2025 年 4 月 9 日 ( 水 ) ~ 4 月 11 日 ( 金 ) に開催されました。 try! Swift Tokyo

私は今回、初めて try! Swift に参加しました。技術カンファレンスへのオフライン参加自体も初めてだったため、すべてが貴重な体験となりました。新しい技術や、自分の知らない領域について学べることを期待して参加しました。また、イベントの雰囲気や、どのような方々が参加されているのかを知るのも楽しみの一つでした。 Gunosy の iOS メンバーである吉岡さんと plusnine さんと一緒に参加しました。

try! Swift の雰囲気

会場で一番印象的だったのは、そのグローバルな雰囲気でした。海外からの参加者が多く、会場のあちこちで英語が飛び交っていました。トークで使用される言語も英語が大半を占めており、まるで海外にいるかのような感覚になりました。英語でのトークが中心で、英語が得意でない方は内容が理解できないのではと思いましたが、トランシーバーによる同時通訳が用意されており、日本語で内容を理解することができました。また、今回から新たな試みとして、try! Swift の公式アプリに AI を活用したリアルタイム通訳機能が追加されていました。フリットジャパン株式会社が開発した Flitto によって、トークの英語が次々と正確に翻訳され、非常に分かりやすかったです。さらに、聞き逃した内容を後から振り返って確認できる点が特に便利だと感じました。英語が苦手な方でもカンファレンスを十分に楽しめる環境を整えていただき、本当に感謝しております！

小野が気になったトーク

Swift × Android: Skipが切り拓くクロスプラットフォーム開発の未来 by yamaken

www.youtube.com

Swift を使って iOS と Android のアプリ開発が可能なクロスプラットフォームフレームワーク「 Skip 」についての内容です。 2024 年 8 月にリリースされた新しい技術で、実際に使用した体験をもとに紹介されています。

主に以下の 3 点について説明されました。

Android の UI について
Skip は Transpiled Mode か Native Mode か
既存アプリの移植が可能かどうか

Android の UI は期待通りに動作し、特別な調整は不要とのことでした。 UI に関して OS 差分を気にする必要がなく開発しやすいと感じました。ただし、ナビゲーションバーのような独自 API には注意が必要で、 SwiftUI と Jetpack Compose の仕様の違いを理解しておく必要があるとのことでした。

既存アプリの移植は不可能ではありませんが、現時点では厳しい挑戦となるようです。 UIImage などの iOS 特有の API は Android では対応していないため、大量の Android コードを記述する必要があるようです。それでも、最近では Skip が Android 用にもコンパイル可能になり、 API サポートも徐々に拡大しているという嬉しい進展がありました。完全なAPIカバレッジが実現すれば、既存アプリの移植も容易になり、 Swift で両 OS を開発できる未来が期待できそうです。 Skip の可能性に大きな期待を感じるトークでした。 Skip の存在は知っていましたが、実際に触れたことがなかったので、この機会に試してみようと思います。

plusnineが気になったトーク

Swiftコード生成の可能性を解き放て by rockname

www.youtube.com

Java ではお馴染みのアノテーション（@Inject等）を用いたコード生成の仕組みを、 Swift で実現する方法についての内容でした。主にスピーカーの rockname さん自作の DI ライブラリSwordでの実装例を元に、

Define Macro
Configure Plugin
Parse
Validate
Generate Code

の5ステップに分けて、各々のステップでの具体的な実装について解説されました。個人的には特に、 BuildToolPlugin を利用したビルドプロセスへの組み込み部分の解説がかなり実用的で参考になりました。加えて、 SwiftParser を利用しての抽象構文木（AST）の構築と要素に対する走査・アクセスの方法についての話もあり、この辺りも自身で内製ライブラリを作る場合に色々内容を参考にできそうです。

吉岡が気になったトーク

SwiftUI Textを使った特殊効果 by Paul Hudson

www.youtube.com

iOS 18 から利用できるようになった SwiftUI の Text Renderer という機能を利用して、テキスト描画をカスタマイズする内容でした。テキスト描画の単位であるLine、Run、Glyphの説明から始まり、文字の形状変化、塗りつぶしの変更、ピクセルシェーダーによる多彩な表現が紹介されました。

題材に 1990 年代風のデザインが使われていたのも面白く、文字描画を自前で処理してカスタムするテクニック自体もとても興味深かったです。SwiftUI の中でシェーダーを使えるというのも新鮮で、一度試してみたくなる内容でした。

たとえば、アプリの初回起動時のチュートリアルなど、視覚的に目を引かせたい場面で活用できそうだと感じました。

try! Swift を通して得たもの

try! Swift では、トークの合間にスポンサーブースを回ったり、技術者同士で会話する時間がありました。
スポンサーブースでは、スポンサー企業が採用している技術や開発環境について説明を受けました。また、アンケートやクイズに答えるなど、楽しいイベントもたくさん用意されていました。特に、開発環境の説明の中で Kotlin Multiplatform（ KMP ）を採用している事例が多く見られ、その導入経緯や成果について話を聞くことができました。これをきっかけに、自社でも KMP の導入を検討してみても良いのではないかという話が出ました。

また、トークで紹介された Apple Vision Pro を使ったサッカー J1 リーグ所属 FC 町田ゼルビアの Immersive Video を実際にブースで体験する機会もあり、とても貴重な経験となりました。

さらに、 2 日目の夜には運営主催の BBQ が開催され、他の参加者と交流する機会もありました。各企業の技術や開発内容について話したり、Swift を趣味として楽しんでいる全く別の職業の方と話したりと、多種多様な方々と交流することができました。こうしたリアルな体験ができるのは、オフラインイベントならではの魅力だと感じました。

イベントを終えて

try! Swift Tokyo 2025 を通じて、これほど多くの人が iOS 開発に携わっていることを改めて実感しました。技術に対してもっと貪欲になり、さらに努力しようと思える良いきっかけとなりました。また、英語でトークを行う日本の方々を見て、自分も英語力を伸ばしていく必要性を強く感じました。

最後に、try! Swift Tokyo に関わるすべての方々、そして参加を支援してくださった会社に心から感謝を込めて、このブログ記事を締めくくらせていただきます。

EMConf JP 2025に参加しました

2025-03-04T11:01:11+09:00

こんにちは。アプリチームマネージャーの吉岡(@rikusouda)です。先日開催されたEMConf JP 2025というエンジニアリングマネージャーがテーマのカンファレンスに参加してきました。

EMConf JPとは

公式サイトからの抜粋ですが、下記のようなカンファレンスです。

Engineering Manager Conference Japan（EMConf JP）は、エンジニアリングマネジメントを実践する皆さんのためのカンファレンスです。

私たちの掲げるテーマは「増幅」と「触媒」。
Engineering Manager（EM）たちが生み出す熱が、より大きく、より広がっていくようなイベントとなることを目指しています。

EMを目指すエンジニアからベテランEM・経営者に至るまでが一同に会すこの場で、ともに学び、悩みを分かち合い、お互いの心に火を灯しましょう！

2025.emconf.jp

印象に残ったセッション

基調講演「エンジニアリングマネージャーのロードマップエンジニアリングマネジメントの4次元と生成AI時代の戦い方」 by 広木大地

EMConf JP 2025 基調講演広木大地氏 - EMConf JP 2025 オフィシャルサイト

hirokidaichi.github.io

EMの概要と重要なポイントを紹介するセッションでした。

印象的だったのは下記のことです。 EMの仕事は「4つのP」つまり「People Management」、「Platform Management(技術的なこと)」、「Project Management」、「Product Management」の4つに別れます。すべてに精通するスーパーマンである必要はありませんが、別に人にお願いをするときにも適切に判断できる程度の知識を持つことが望ましいとされていました。これまで「Product Management」はEMの仕事とは別と考えていましたが、そうした分野にも関わることで、活躍の幅が広がると理解しました。

一番印象的だったことは、「マネジメントの意味は なんとかする こと」であり「管理」ではないということでした。EMの仕事とは何か、細かい話は色々ありますが、全てはここに集約されるのだと思います。

AIがこれからの開発現場にどの用に関わってくるのかの話も印象的で「全てのエンジニアは、AIをメンバーに持つエンジニアリングマネージャーになる。」という言葉はとても腹落ちしました。

エンジニアリング価値を黒字化する、バリューベース戦略を用いた技術戦略策定の道のり by Kazuki Maeda

エンジニアリング価値を黒字化する、バリューベース戦略を用いた技術戦略策定の道のり by Kazuki Maeda | トーク | Engineering Manager Conference Japan 2025 #emconf_jp - fortee.jp

speakerdeck.com

エンジニアリングの価値をわかりやすく表現する方法について説明されていました。

とくに印象に残ったことは、開発コストは工数面だけではなく開発者の満足度も指標となっていて、退職されずに引き止めるために多めの報酬が必要となるような状況はコストが高い状況とみなされるということでした。

私の理解として、リファクタリングの効果は「将来の開発工数の削減」と認識していましたが、開発者体験を向上させることもコスト削減と考えると意思決定の仕方も変わってくるかなと思いました。

基調講演「n=1の経験が紡ぐエンジニアリングマネジメントの可能性」 by 岩瀬義昌

EMConf JP 2025 基調講演岩瀬義昌氏 - EMConf JP 2025 オフィシャルサイト

speakerdeck.com

「なんとかする」ためにあらゆることをやってきた実例の紹介で大変参考になりました。

一番心に響いたのがは「自分は今、何を成し遂げたくて働いているのだろう?」「そこに(自らが共感する)大義はあるだろうか?」という問いでした。アウトプットは「メンバーの能力 * メンバーの熱量 - チームや組織の摩擦・制約など」であるという説明がありました。これはEM自信にも当てはまっていて、自らの役割に大義を見出して熱量を上げることも、チームのアウトプットの総量を上げることに効果的ではないかと気が付かされました。

感想

いままではiOS関連のカンファレンスにしか参加したことがなかったので、マネジメント分野のカンファレンスが新鮮で良い刺激になりました。

今回は懇親会のチケットが売り切れで入手できなかったこともあり、周りの参加者と話す機会をあまり作ることができず、半分消化不良で終わってしまった部分もあるのでもし次回があるなら懇親会チケットを入手できるようにチケット争奪戦に出遅れないようにしたいと思いました。

アンカンファレンスや休憩ルーム、Ask the Speaker などを活用し、懇親会以外にも話す機会が多くあった点は良かったと感じました。

私自身、こうしたコミュニティの一員でいたいという意識がモチベーション向上につながるため、今回のカンファレンス参加は非常に有意義な機会となりました。

Android Jetpack Composeで破線付きテキストの作り方

2025-02-26T15:00:00+09:00

こんにちは。Android アプリ開発担当の nagayama（@nagayan_dev）です。

今回は Jetpack Compose で破線付きテキストの作り方をご紹介します。

はじめに
下線付きテキストの作り方
破線付きテキストの作り方
- 1. 破線を描く
- 2. 描いた破線を Text の下に表示する
まとめ

はじめに

テキストに線を加える表現方法にはさまざまな種類があります。強調したい場合は「下線」を、変更履歴を示したい場合は「取消線」を使うことが一般的です。その中でも、軽い強調として「破線」を加えたテキスト表現があります。今回は、この「破線付きのテキスト」をJetpack Composeで実現する方法をご紹介します。

下線付きテキストの作り方

まずは下線付きテキストについて解説します。

Text の引数で TextDecoration を指定することができます。TextDecoration は Text と一緒に描画する横線を設定するものになります。種類としては下線 (Underline) と取消線 (LineThrough) が用意されており、下記のように引数に指定するだけで簡単に描画することができます。

Column {
    Text(
        text = "下線",
        textDecoration = TextDecoration.Underline,
    )
    Text(
        text = "取り消し線",
        textDecoration = TextDecoration.LineThrough,
    )
}

破線付きテキストの作り方

では本題の破線付きテキストについてです。

残念ながら下線のように用意はされておらず、自作する必要があります。

方法としては、

破線を描く
描いた破線を Text の下に表示する

とやっていきます。

1. 破線を描く

破線の描画方法です。 Canvas を使用します。

まず Canvas で線を描画するため、Canvas の onDraw で drawLine を行います。

主に設定するパラメータは下記になります。

color：線の色
start：線の描画開始位置（ Offset 型）
end：線の描画終了位置（ Offset 型）
strokeWidth：線の太さ
cap：線の端の表現（Butt 又は Round 又は Square）
pathEffect：線のオプション効果

横方向の線を描画するために、 start と end の引数に指定する Offset 型の y 値は同じ size.height にし、 x 値を 0f から size.width に設定します。

線を破線にするために、pathEffect に PathEffect.dashPathEffect を設定します。引数は

intervals：「破線 1 つの長さ」と「破線の間隔」を配列で定義します。そのため要素数は偶数になります。
phase：intervals に対するオフセット値。破線の開始位置をずらしたい場合に値を調整します。不要な場合は「破線 1 つの長さ」と「破線の間隔」を足した値を設定します。

です。

実装は下記のようになります。

// 線の太さ
val strokeWidth: Float = 4f
// 破線1つの長さ
val dashedLength: Float = 30f
// 破線の間隔
val dashedInterval: Float = 15f
Canvas(
  modifier = Modifier
              .fillMaxSize(),
  onDraw = {
    drawLine(
      color = Color.Red,
      start = Offset(0f, size.height),
      end = Offset(size.width, size.height),
      strokeWidth = strokeWidth,
      cap = StrokeCap.Round,
      pathEffect = PathEffect.dashPathEffect(
        intervals = floatArrayOf(dashedLength, dashedInterval),
        phase = dashedLength + dashedInterval,
      )
    )
  }
)

2. 描いた破線を Text の下に表示する

続けて、先ほど作成した破線を Text の下に描画させます。

Column を用いて上に Text を、下に破線を配置します。上記のコードをそのまま配置すると破線だけ大きく表示されてしまうため、modifier を Modifier.matchParentSize() に設定します。これによりText のサイズと合わせて表示してくれます。

Box {
  Text(text = "破線付きテキストの作り方")
  Canvas(
    modifier = Modifier
                    .matchParentSize(),
    onDraw = {
      drawLine(
        ~省略~
      )
    }
  )
}

以上が破線付きテキストの作成方法になります。

最後に Text の必要な引数を添えて、破線付きテキストを共通で使用できるよう Composable を作成します。

@Composable
fun DashedText(
  text: String,
  modifier: Modifier = Modifier,
  color: Color = Color.Unspecified,
  fontSize: TextUnit = TextUnit.Unspecified,
  fontStyle: FontStyle? = null,
  fontWeight: FontWeight? = null,
  fontFamily: FontFamily? = null,
  letterSpacing: TextUnit = TextUnit.Unspecified,
  textDecoration: TextDecoration? = null,
  textAlign: TextAlign? = null,
  lineHeight: TextUnit = TextUnit.Unspecified,
  overflow: TextOverflow = TextOverflow.Clip,
  softWrap: Boolean = true,
  maxLines: Int = Int.MAX_VALUE,
  minLines: Int = 1,
  onTextLayout: ((TextLayoutResult) -> Unit)? = null,
  style: TextStyle = LocalTextStyle.current,
  // 破線の色
  dashedColor: Color = Color.Unspecified,
  // 破線の太さ
  dashedWidth: Float = 4f,
  // 破線1つの長さ
  dashedLength: Float = 30f,
  // 破線の間隔
  dashedInterval: Float = 15f
) {
  Box(
    modifier = Modifier
                .wrapContentWidth(),
    contentAlignment = Alignment.BottomCenter
  ) {
    Text(text, modifier, color, fontSize, fontStyle, fontWeight, fontFamily, letterSpacing, textDecoration, textAlign, lineHeight, overflow, softWrap, maxLines, minLines, onTextLayout, style)
    Canvas(
      modifier = Modifier
                  .matchParentSize()
    ) {
      drawLine(
        color = dashedColor,
        start = Offset(0f, size.height),
        end = Offset(size.width, size.height),
        strokeWidth = 2f,
        cap = StrokeCap.Round,
        pathEffect = PathEffect.dashPathEffect(
          intervals = floatArrayOf(dashedLength, dashedInterval),
          phase = dashedLength + dashedInterval,
        )
      )
    }
  }
}

残念ながら今回ご紹介した破線付きテキストは 1 行のみの対応例になります。複数行を可能にするには描画するテキストの長さや行間隔を考慮する必要があります。

まとめ

Jetpack Compose で破線付きテキストの作り方をご紹介しました。下線や取消線といったメジャーなテキストの表現を簡単に実現できる方法が用意されていました。また破線付きテキストといった特殊な表現でも、Canvas を活用することで綺麗に実装できます。Jetpack Compose の柔軟性と応用力の高さが感じられますね。これからも Jetpack Compose ライフを楽しみましょう。

SREの役割をテックリードに委譲しました

2024-12-25T12:09:24+09:00

メリークリスマス、id:skozawa です。

こちらの記事は Gunosy Advent Calendar 2024 の 25 日目の記事です。昨日はテックリードの役割定義の話をさせてもらいました。今日はその役割であるテクノロジーマネジメントの一部となる SRE についてお話しします。

背景
SRE の組織パターン
Gunosy での SRE のこれまでとこれから
TL が集まる会
まとめ
参考

背景

これまで Gunosy には SRE チームがあり、インフラ整備やセキュリティ対応などを主導してもらっていましたが、メンバーの入れ替えなどもあり、組織体制の変更が必要となりました。 SRE チームを存続させることも検討しましたが、役割委譲が可能だと考え、SRE チームを解体し、テックリード（TL）を中心とした SRE 体制へと移行することにしました。

SRE の組織パターン

SRE を組織に実装するパターンはいくつかあり、組織の状況に応じて実装されています。大きく分けると以下の 3 パターンになります。

Platform SRE / Central SRE
- プロダクト横断的な SRE チームで、共通基盤の構築などを担当。
- EKS の構築や生産性を上げるツールの提供なども担当
  - SRE at Google: How to structure your SRE team | Google Cloud Blog
Enabling SRE
- Platform SRE と同様にプロダクト横断的な SRE チームだが、主にプロダクトチームに SRE の機能や文化を浸透させる。
Embedded SRE / Product SRE
- プロダクトチームに所属し、信頼性の向上に取り組む。

サイバーエージェントさんでは Product SRE、Embedded SRE、Platform SRE、SRE Center of Practice、Movable Embedded SRE の 5 パターンで実装されていたり、マネーフォワードさんでは Platform SRE、Enabling SRE、Product SREs の 3 パターンが実装されているようです。

developers.cyberagent.co.jp moneyforward-dev.jp

Gunosy での SRE のこれまでとこれから

これまでの Gunosy の SRE チームは Platform SRE もしくは Enabling SRE として活動してきましたが、組織体制の変更に伴い、Enabling を進めつつ Embedded SRE の体制を目指しました。 Embedded SRE 体制に移行するために色々と自動化を進めつつ、TL を主体に SRE の役割を担っていく体制に変更しました。

tech.gunosy.io

TL が集まる会

これまでは SRE がハブとなり、技術的な相談や知見交換が行われてきましたが、Embedded SRE にするとハブがなくなり知見の集約が難しくなります。そこで TL が集まる会を開催し、各チームの技術課題やセキュリティ対応状況などの知見交換をする場を設けました。

アジェンダとしては以下のようなものです。

各チームの SLO 振り返り
障害の確認と対応に対するレビュー
相談・ディスカッション
技術ネタ雑談

まだできていませんが、各チームの技術的意思決定や大きめのシステム設計のレビューなどもできると良さそうだなと感じています。

まとめ

SRE の役割を各チームに委譲し、TL を中心に運用していく体制に変更しました。今のところ、大きな問題なく運用できていますが、SRE の専門性に明るいというわけではないので、専門的な知識をどのようにカバーしていくかは今後の課題です。 SRE の役割も組織のフェーズに応じて変わるため、体制自体も柔軟に考えていきたいです。

さて、無事アドベントカレンダーを完走できました！お疲れ様でした。

参考

テックリードの役割を定義しました

2024-12-24T12:32:46+09:00

こんにちは。 id:skozawa です。

こちらの記事は Gunosy Advent Calendar 2024 の 24 日目の記事です。昨日は上村さんの「LLM で Web 検索を効率化！- Web 検索エージェントとブラウザ拡張によるアプローチ」でした。

背景
エンジニアのマネジメント領域
TL の見直し
EM と TL の役割定義
キャリアパスの見直し
まとめ

背景

Gunosy にはエンジニアマネージャー（EM）とテックリード（TL）、リードエンジニア（LE）という役職があります。 LE については以前に定義しましたが、EM と TL については役割分担が明確化されておらず、EM に負荷が集中しがちになるという課題があったため、役割を見直すことにしました。 EM と TL の役割を再定義し、TL は役職から役割に変更しました。また、それに伴いキャリアパスを見直すことにしました。

tech.gunosy.io

エンジニアのマネジメント領域

エンジニアのマネジメント領域の分け方にはいくつかあり、プロダクト、テクノロジー、チームの 3 領域をエンジニアマネジメントトライアングルという形で表したり（エンジニアリングマネジメントトライアングルの考察：序）、強い EM、弱い EM という定義のもとにプロダクト、プロジェクト、テクノロジー、ピープルの 4 つ領域で表したりしています（エンジニアリングマネージャ/プロダクトマネージャのための知識体系と読書ガイド）。

今回は上記を参考にして、役割定義をするにあたり、以下の 5 つのマネジメント領域に分けて利用することにしました。

プロダクトマネジメント
プロジェクトマネジメント
テクノロジーマネジメント
チームマネジメント
メンバーマネジメント

steam.place qiita.com

TL の見直し

EM の役割に大きな認識の差はありませんでしたが、TL のイメージが人によって異なっていました。これまでは、TL は技術力が高い人というイメージが強かったのですが、TL に求めたいのは技術力だけではありません（技術力も大事です）。

エンジニアのためのマネジメントキャリアパスにも、以下のような記載があり、

テックリード ≠ チームで最も優秀な、あるいは最も経験豊富なエンジニア

テックリードが最優先しなければならないのは「プロジェクトを推進するため、常に対局的な視点を失わないこと」

テックリードの主な役割として以下が挙げられています。

システムアーキテクトとビジネスアナリストとしての役割
プロジェクトプランナーとしての役割
ソフトウェア開発者兼チームリーダーとしての役割

そのため、Gunosy では TL を「EM と並走するサブマネージャー」という位置付けにしました。また、TL を役職から役割に変更することで持ち回りで役割を担えるようにし、後進育成への柔軟性も高めるようにしました。 Gunosy での TL は、スタッフエンジニアで定義されているテックリードと似ていますが、スタッフエンジニアのような上級エンジニアではなく、もう少しライトな位置付けとしています。

エンジニアのためのマネジメントキャリアパス ―テックリードからCTOまでマネジメントスキル向上ガイド

作者:Camille Fournier
オライリージャパン

Amazon

スタッフエンジニア　マネジメントを超えるリーダーシップ

作者:Will Larson
日経BP

Amazon

EM と TL の役割定義

EM と TL で、5 つのマネジメント領域を以下のように割り当てました（一部を表に載せます）。実際には EM と TL のそれぞれのスキルに応じて分担し直したり、役割を超えたマネジメントも期待しています。

主なポイントとしては以下の 2 点ですが、EM と TL がお互いの特徴を活かしあって協力することが大事になります。

TL と EM で協力してプロジェクト、チームマネジメント
テクノロジーマネジメント、チーム・メンバーの技術力向上は TL が主体的に行う

キャリアパスの見直し

EM と TL の役割を見直したため、キャリアパスも見直しをしました。もともとは EM もしくは TL に分岐するパスを想定していましたが、EM の前段階として TL を経験してもらうパスに変更しています。

変更した意図としては以下となります。

できるだけ EM も TL も経験できるように
- EM としてキャリアを築くにしても、TL としてキャリアを築くとしても、それぞれの役割を理解し相互に連携できることがチームとしては重要になる
段階的に役割を担えるように
- 自身の役割範囲を徐々に拡大してもらう

大枠のパスの見直しはしたものの、まだキャリアラダーの整備などはできていません。キャリアラダーやガイドラインなどを参考に検討していきたいです。

まとめ

EM と TL の役割を見直し、段階的に役割を担ってもらえるようにキャリアパスも再設計しました。まだ運用を開始したばかりのため、改善を進められればと思います。

明日は引き続き、私から SRE の役割委譲の話をしたいと思います。お楽しみに！

LLMでWeb検索を効率化！- Web検索エージェントとブラウザ拡張によるアプローチ

2024-12-23T12:00:00+09:00

はじめに

こんにちは。新規事業開発室の上村 id:muemura です。

本記事は、Gunosy Advent Calendar 2024 23日目の記事です。昨日の記事は、 imai さんの「まとめ記事の不適切表現を検出するためにLLMを活用した話」でした。

tech.gunosy.io

今回は、新規事業開発室で開発した「ウデキキ」という業務支援ツールで開発した、Web検索を効率化するための取り組みについて紹介します。

はじめに
ウデキキのWeb検索支援機能について
おわりに

ウデキキのWeb検索支援機能について

ウデキキは、以前の記事「ChatGPTを活用した業務支援ツール「ウデキキ」のチャット実装」や「LLM を用いた PDF を元にした回答と、該当箇所のハイライト」でも紹介していますが、LLMを活用した業務支援特化の生成AIサービスです。自分の業務に合わせて、事前にプロンプトがセットされたスキルを選択することで、目的に応じたサポートを受けることができます。

ウデキキでは、ユーザーが効率的に情報収集を行えるように、Web検索の支援に特化したスキルを提供しています。今回はその中でも、「Web検索エージェントスキル」と「ブラウザ拡張による検索支援」のアプローチについて紹介します。

Web検索エージェントスキル

ウデキキのWeb検索エージェントスキルは、LLMを活用して、ユーザーが入力したキーワードに関連する情報に対して、ウデキキがWeb検索を行い、その要約結果を返すスキルです。先日、本家のChatGPTでもテスト版からついに「ChatGPT Search」として正式リリース*1されましたが、それと同じような機能をウデキキでも提供しています。下記は、実際のWeb検索エージェントスキルの画面です。

Web調査エージェントスキル

実装例はインターネット上に多くの記事が公開されているので、今回は省略させていただいて、特にアプローチの概要についての紹介しようと思います。以下のフローチャートは、Web検索エージェントスキルのアプローチを示しています。

Web調査エージェントのフローチャート

簡単にポイントを説明していきます。

まず初めに、ユーザーの入力から検索キーワードの抽出を行うのですが、ここで気を付けなければいけないのは、ユーザーが入力した最新の文章だけでなく、それまでの会話の文脈を考慮してあげる必要があります。やりとりを通じて発生した新たな疑問等、真にユーザーが求めている回答を提供するためには、これらの情報も考慮する必要があります。そのため、過去のやりとりも入力にいれつつ、 ChatGPT の Function calling 機能を用いて検索キーワードの抽出を行っています。

その後、検索キーワードを用いてWeb検索を行います。今回は Azure の Bing Search API を利用しています。Bing Search API は、キーワードに関連するWebページのタイトルとURLと概要（snippet）を返すため、この情報を用いてユーザーに回答を生成することが可能になります。

しかし一方で、概要だけでは回答には情報が不十分な場合が多いため、特に上位3件については、Webページの内容を取得して、それを元にユーザーに情報を提供するようにしています。ただし、Webページの内容を、そのままユーザーに提供するのではなく、ページ毎に抽出型要約を行っています。これにより、Webページの内容自体が、雑多で不要な情報があった場合でも本質を漏らさず、最終的な回答に繋げることができるようになりました（もしかしたら、最新のLLMを利用すると抽出型要約等のステップは必要がないかもしれませんが、実験を行っていたのが少し前の話なので、最新のモデルを使うとまた異なるアプローチが良いかもしれません）。

またその他のポイントとして、LLMに要約を生成させる際に、ユーザーの元の質問文や、検索クエリ等の前段の情報を一緒にプロンプトに含めてあげることで、より良い回答を生成することができるようになりました。やはり、どんなモデルを使っていたとしても、プロンプトの設定は重要になってくるため、この辺りは試行錯誤が必要だと感じています。

ブラウザ拡張による検索支援

ウデキキは、Webアプリケーションとは別に、ブラウザでの業務支援を行うために、ブラウザの拡張機能を用いたサポート機能を提供しています。具体的には下記の画像のように、任意のWebページ上にサイドバーとしてウデキキの機能を表示することができ、目的に応じたサポートを受けることができるようになっています。その中で提供する機能の一つとして、Web検索支援のための機能があります。

ウデキキのブラウザ拡張機能

ブラウザ拡張のWeb検索支援機能では、ユーザーが閲覧しているWebページから、その内容を元にユーザーに要約を行ったり、内容についての質問を受け付けたりすることができるようになっています。

例えば、インターネットで調べ物をするとき、Web検索を行うことになると思いますが、その際には、検索結果から自分の求める情報が書かれていそうなページを探して、その内容を確認するという手順を踏むことが一般的です。しかし、ウデキキのブラウザ拡張では、Web検索の要約を用いることで、ユーザーは検索を行ったページに逐一アクセスすることなく、検索したキーワードに関連する情報を取得することができるようになります。これにより、ユーザーが効率的に情報収集を行うことができるようになることを目指しています。

実際の画面としては、下記の画像になります。

ブラウザ拡張でのWeb検索支援機能の例

このように要約結果とともに、検索キーワードについて理解を手助けするような質問を提示することで、必要に応じてユーザーがより詳しく情報を調べることができるようになっています。

機能の裏側では、LLMにインプットする情報として、URLから抽出した検索クエリと、検索結果であるページ上のHTMLの内容を渡すことで、キーワードに基づいた情報を主体とした要約を行っています。また同時に、フォローアップの質問を生成して表示しているのですが、ユーザーはこの質問をクリックすることで、ページの情報を引き継いだままチャットを続けることができ、より深い理解を得る手助けをすることができるようになっています。

補足

今回は割愛していますが、Webページ上のコンテンツを扱ったLLMの機能開発には注意が必要です。特に、検索結果を入力としてLLMに与えたとして、それが著作権侵害を行っていたページだった場合、その情報を用いて文章生成をしたとして、著作権侵害となってしまうことがあり得ます。

そのため、Webの情報を用いた回答生成サービスを作成するにあたっては、著作権に配慮した実装・プロンプトチューニングを行うことが重要です。LLMのプロバイダーによっては、著作権に関するガイドライン等*2 *3があるため、それを参考にしながら実験・実装を行うことをお勧めします。

おわりに

今回は、新規事業開発室で開発した「ウデキキ」で取り組んだ、Web検索エージェントスキルとブラウザ拡張によるWeb検索支援のアプローチについてご紹介しました。

個人的にも、今後は業務の中でいかにLLMを活用しつつ、効率化を図るかが重要になってくると考えています。特にエンジニアであれば Copilot のようなコーディングのサポートも重要ですが、設計や調査などの業務においても、LLMを活用することで、より効率的に業務を進めることが重要になると感じています。その中でも、今回紹介したようなLLMによるWeb検索支援のアプローチが誰かの役に立てば幸いです。

明日の記事は id:skozawa さんの「テックリードの役割を定義しました」です！アドベントカレンダーも残す所もう僅か残り2日ですが、最後まで張り切っていきましょう！

*1:https://openai.com/index/introducing-chatgpt-search/

*2:https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/safety-system-message-templates

*3:https://news.microsoft.com/ja-jp/2023/09/12/230912-copilot-copyright-commitment-ai-legal-concerns/

まとめ記事の不適切表現を検出するためにLLMを活用した話

2024-12-22T10:00:00+09:00

こんにちは、プロダクト開発部のimaiです。

こちらの記事は Gunosy Advent Calendar 2024 の 22 日目の記事です。

この記事では、まとめ記事の不適切表現を検出するためにLLMを活用した取り組みについて紹介します。

背景

グノシーアプリでは、ユーザーに様々な記事を提供しており、その中にまとめ記事も含まれています。まとめ記事とは2ch等のまとめサイトの記事のことです。

これらのまとめ記事の中には不適切なコンテンツが含まれる可能性があるため、そういった記事の露出を防ぐためにまとめ記事を監視して定められた判定ルールに基づき、人の目で記事の露出可否を判定していました。

こういった人手による目視確認を行っておりましたが、運用コストが大きな課題となっていました。

そのため、LLMを活用して不適切表現を検出し、運用者の判断を支援する仕組みを実装することにしました。

システム概要

まとめ記事の判定をLLMを使って半自動化するために、以下のようなシステムを実装しました。

まとめ記事に関するデータを取得
まとめ記事の情報（タイトルと本文）と合わせてプロンプトをLLMに投げる
プロンプトで指定した返答形式に基づいた判定結果のレスポンスを保存
まとめ記事一覧画面でLLMによる判定結果を表示
運用者が判定結果を確認し、記事の露出可否（CLEAR/NG）を最終判断
判断結果をDBに保存し、アプリでの記事表示制御に反映

システムは大きく分けて二つの部分で構成されています。

LLM判定用バッチ(1~3)：このバッチ処理はAWS上で実装しており、EventBridgeで定期的にトリガーされるLambda関数として実装。OpenAI APIを使用して記事の判定を実行
管理画面(4~6)：運用者によってLLMによるまとめ記事の判定結果を確認、判定するための画面

システム構成図

LLM判定の実装

システムは大きくLLM判定バッチと管理画面の二つで構成されていますが、この記事ではLLM判定バッチの実装について詳しく説明します。まとめ記事のLLM判定には、OpenAI APIを利用しています。

判定の仕組み

LLMには「まとめ記事の監視システム」としての役割を与え、記事内容を分析して不適切な表現の検出と数値的な評価を行わせています。

不適切表現の項目としては主に以下のようなものを設定しています

不快表現
企業批判
卑猥
国籍差別

そして検出された不適切表現それぞれについて

不適切表現の検出と該当箇所の特定
判定理由の説明
不適切度合いのスコアリング（0-100）

といった情報を決められた形式で返却するようにしています。

判定結果の形式

判定結果はJSON形式で受け取り、NGカテゴリごとに該当の文章と判定理由、不適切度合いを表すスコアを返します。

以下は実際の判定結果の例です

{
 "check_rules": [
   {
     "ng_label": "不快表現",
     "reason": "年齢に基づく侮蔑的な表現を使用しており、不快感を与える内容であるため。",
     "score": 70,
     "sentence": "33歳とかメスガキやん",
   },
   {
     "ng_label": "職業差別",
     "reason": "特定の年齢層の女性に対して否定的な表現を用いており、職業や社会的地位に基づく差別的な見解を示しているため。",
     "score": 80,
     "sentence": "適齢期のがしたババアって大抵拗らせてるけど男側からしてもその面倒くささを払拭してアプローチするだけの魅力がないから独身が続く負のスパイラルに入ってるよな",
   }
 ]
}

バッチ処理の実装

バッチ自体はGoで実装しています。まとめ記事の判定には、記事のタイトルと本文の両方が必要なため、これらの情報をLLMに適切に伝える必要がありました。

そこで、Goのtext/template パッケージを使用してテンプレートファイルからプロンプトを動的に生成し、記事情報を埋め込める仕組みを実装しました。また、プロンプトのテンプレートファイルはGoのembed機能を利用して読み込めるようにしました。

プロンプトテンプレートに記事のタイトルと本文を埋め込んで生成

//go:embed prompts/check_article_expression.tmpl
var checkArticleExpressionTmpl string

// プロンプト生成用の構造体
type PromptInput struct {
    ArticleTitle string
    ArticleBody  string
}

func generatePrompt(articleTitle string, articleBody string) (string, error) {
    // プロンプトテンプレート読み込み
    tmpl, err := template.New("prompt").Parse(checkArticleExpressionTmpl)
    if err != nil {
        return "", fmt.Errorf("failed to parse template: %w", err)
    }

    // 記事情報を使ってプロンプトを生成
    var buf strings.Builder
    input := PromptInput{
        ArticleTitle: articleTitle,
        ArticleBody:  articleBody,
    }
    if err := tmpl.Execute(&buf, &input); err != nil {
        return "", fmt.Errorf("failed to execute template: %w", err)
    }

    return buf.String(), nil
}

LLMによる記事判定の実行

// 記事判定結果の構造体
type Result struct {
    CheckRules []CheckRule `json:"check_rules"`
}

type CheckRule struct {
    NGLabel  string `json:"ng_label"`
    Score    int    `json:"score"`
    Sentence string `json:"sentence"`
    Reason   string `json:"reason"`
}

// LLMによる記事判定
func judgeArticle(ctx context.Context, prompt string) (Result, error) {
    // 期待するレスポンスのJSONスキーマを生成
    var result Result
    schema, err := jsonschema.GenerateSchemaForType(result)
    if err != nil {
        return Result{}, fmt.Errorf("failed to generate schema: %w", err)
    }
    resp, err := openaiClient.CreateChatCompletion(ctx, openai.ChatCompletionRequest{
        Model: openai.GPT4oMini,
        Messages: []openai.ChatCompletionMessage{
            {
                Role:    openai.ChatMessageRoleSystem,
                Content: "あなたはインターネット記事の内容を監視し、不適切な表現を検出するシステムです。",
            },
            {
                Role:    openai.ChatMessageRoleUser,
                Content: prompt,
            },
        },
        ResponseFormat: &openai.ChatCompletionResponseFormat{
            Type: openai.ChatCompletionResponseFormatTypeJSONSchema,
            JSONSchema: &openai.ChatCompletionResponseFormatJSONSchema{
                Name:   "judge_article",
                Schema: schema,
            },
        },
    })
    if err != nil {
        return Result{}, fmt.Errorf("OpenAI API error: %w", err)
    }

    var result Result
    if err := json.Unmarshal(resp.Choices[0].Message.Content, &result); err != nil {
        return Result{}, fmt.Errorf("failed to parse response: %w", err)
    }

    return result, nil
}

LLMからのレスポンスは、JSONスキーマを使って指定した形式のレスポンスを生成するようにしています。当初レスポンスをJSON形式で返すためにレスポンスフォーマットをjson_objectに指定していたのですが、レスポンスの構造が一定にならない問題がありました。そこでjson_schemaに変えたところレスポンスの形式が一定にならない問題を解決できました。

まとめ

今回の記事ではまとめ記事の不適切表現を検出するためのLLMを活用した仕組みについて、GoとOpenAI APIを使用した実装方法を中心に紹介しました。

この仕組みの導入により、一部の記事は自動でNG判定を行い記事の露出を制御できるようになり、人手による確認作業を3割程度削減することができました。現状はまだ多くの記事でLLMでの判定結果をもとに運用者が最終的に記事の露出可否を判断するようになっていますが、今後はより自動化された判定プロセスの実現を目指していきたいと考えています。

AIニュースコメンテーターを作りました (コメント評価)

2024-12-21T11:00:00+09:00

はじめに

こんにちは、ML チームの村田（id:marice0819）です。

この記事は Gunosy Advent Calendar 2024 の 21 日目の記事です。
昨日の記事は Sho Sundberg さんの『クラウドサービスとRails 7: Master Keyの管理で何故か沼るのは自分だけ？』でした。

はじめに
背景
プロンプトエンジニアリングの評価
- オラクルな情報を与えてのコメントの定性評価
  - 有益性の向上度合い
  - 高度な推論の限界
経済・スポーツドメインでの人手評価
まとめ
おわりに

背景

グノシーでは最近 AI コメンテーターという機能をリリースしました。この機能は LLM を用いて、グノシーで配信されるニュース記事に対してキャラクターがコメントを生成するものです。この記事では、AI コメンテーターがコメントを生成する際に、プロンプトを調整しつつ行った実験結果を紹介します。

プロンプトエンジニアリングの評価

オラクルな情報を与えてのコメントの定性評価

まず、あらかじめ「理想的（オラクル）」な関連情報をモデルに提示することで、期待する品質水準のコメントを LLM が生成できるかどうかを確認する実験を行いました。具体的には、記事本文に加えて品質が保証された関連度の高い外部データを与えることで、単なる記事要約以上の深みや有益性を備えたコメントを引き出せるか、その定性評価を行っています。以下に、その結果をまとめます。

有益性の向上度合い

関連情報を追加することで、記事本文にはない補足情報をコメントに付与できたケースは人手評価で約半数強に上りました。これは、適切な関連文書が提示されれば、モデルはその内容を参考に、ユーザーが「得した」と感じられる程度の有益なコメントを生成できる可能性を示唆しています。

高度な推論の限界

一方、理想的な外部情報を提供しても、深い解釈や高度な背景知識の統合といった人間と同等の多面的な推論はほとんど確認できませんでした。外部情報の導入によって一定の有益性向上は見られるものの、さらなる高度な洞察を引き出すには、プロンプト設計やモデル側の改良など、継続的な改善が必要であると考えられます。

経済・スポーツドメインでの人手評価

次に、理想的な環境でなく実運用する予定のシステムで生成されたコメントに対して人手評価を行いました。プロジェクトの初期段階の検証として、経済ドメインとスポーツドメインで専門家・人間アノテーターによる満足度、有益性など複数の観点から評価を実施し、以下の知見を得ました。

基礎集計結果

総合満足度
- 経済ドメインでは、システムが生成したコメントの総合満足度は、人間の専門家コメントと同等か、それ以上の評価を得る場合がありました。
- スポーツドメインでは、人間コメントに比べてシステムは明確に劣る評価を受けました。
記事横断的な総合評価
- 複数アノテーターの評価を平均化すると、全体としてシステムのコメントがやや高評価になる傾向がありました。ほとんどの観点でシステムが高評価を得るケースも多く、「システムは中庸なコメントを出しやすいため、無難さが有利に働く」という仮説が示唆されます。

定量分析

アノテーター間一致度
- 全体満足度については、評価者間での意見の一致はあまり見られず、カテゴリ（スポーツ・経済）に依存せず評価がばらつく傾向がありました。
- 一方、有益性に関しては経済ドメインでアノテーター間の一致度が比較的高いことが確認できました。
総合満足度と評価観点との相関
- 経済ドメインおよび全体では、「有益性」や「わかりやすさ」が総合満足度に強く影響していました。
- スポーツドメインでは、「有益性」「わかりやすさ」に加え、「関連性」や「客観性」も総合満足度に影響を及ぼしていました。

定性分析

経済ドメイン
- システムが「意外性のある観点」を取り入れることで、高評価に繋がる場合が確認されました。
- 一方、専門用語（カタカナ用語）を多用するだけで中身が乏しいコメントは低評価を受けやすい傾向がありました。
スポーツドメイン
- 経済ドメイン同様、意外性のある観点を提示すると評価が上昇する傾向がありました。
- しかし人間コメントは、豊富な背景情報や細かな補足説明により高評価を維持するのに対し、システムは的外れな視点を提示することがあり、低評価につながりやすい点が課題として浮き彫りになりました。

これらの分析から、スポーツドメインは経済ドメインに比べてシステムが苦手である可能性が示唆されます。これはスポーツがモデルにとって低リソースなドメインであり、学習時の知識カバレッジが不十分なことに起因するかもしれません。
この仮説に基づけば、社会・政治など、ニュース量が多く知識バイアスがかかりやすい分野では、より安定的で有益なコメントを生成できる可能性があります。

まとめ

本記事では、グノシーの AI コメンテーター機能において、プロンプトエンジニアリング手法やオラクルな外部情報の付与によるコメント品質向上の試み、さらに経済・スポーツドメインを対象とした人手評価結果を紹介しました。

主なポイントは以下の通りです。

オラクルな外部データを用いた評価
- 関連度の高い情報を追加することで、有益性が向上するケースは増える一方、より深い洞察や高度な推論には課題が残ります。
経済・スポーツドメインでの人手評価結果
- 経済ドメインではシステムコメントが専門家コメントと同程度、またはそれ以上の評価を得ることもありました。
- スポーツドメインでは、背景知識や解像度で専門家コメントに劣り、的外れな観点を提示するケースが目立ちました。
総合的な示唆
- 一貫性や有益性、意外性のバランスを保つためには、プロンプト設計の工夫やドメイン特性に応じた情報活用が鍵となります。

おわりに

コメント生成にはまだ多くの課題が存在しますが、今後もプロンプトやモデル、データ収集手法の改善を続け、よりユーザーに価値あるコメントを提供できるよう取り組んでいきます。

次回の記事は takahiro imai さんによる『LLMを活用したまとめ記事判定について』です。お楽しみに！

クラウドサービスとRails 7: Master Keyの管理で何故か沼るのは自分だけ？

2024-12-20T12:00:00+09:00

こんにちは、以前は広告技術部でエンジニアをしていましたが、最近社内転職でメディア事業部のサービスPM/POになった、サンドバーグです。最近は仕事でコードを書く機会がHTMLとJSだけになってしまったので、PM/PO関連の記事を書くと思いきや、普通にRailsについて書こうと思います！

この記事はGunosy Advent Calendar 2024 - Adventarの20日目の記事です。昨日の記事はmtjuneさんの『ECS で動く Web サーバーを安全に終了させる話』でした。今回の記事では、開発の現場から離れたことで逆に個人で一からRailsアプリを作る機会が増え、よく直面するMaster Keyと、プロダクションリリース時のassets:precompileの問題についてお伝えします。

はじめに
そもそも Master Key とは
Docker、クラウドサービスとRailsでのMaster Key管理の課題・問題
解決策とベストプラクティス...?
まとめ

はじめに

このエラーメッセージ見たことあります？

Missing encryption key to decrypt file with. Ask your team for your master key and write it to config/master.key or put it in the ENV['RAILS_MASTER_KEY'].

もしくはこちら、

ArgumentError: Missing secret_key_base for 'production' environment, set this string with rails credentials:edit

今回記事のタイトルには Rails 7 と記載しましたが、この話自体はRails 5.2から始まっている認識です。上記のエラーは至って単純で、5.2から導入された credentials.yml.encをデコードするための Master Key が無いと怒られています。

そもそも、rails credentials:edit で機密情報などを登録していればローカル環境では何も考えずに動くはずです。master.keyは自動で用意されますし、意識しなくともアプリ起動までは行けるはず...なんですが、大体の問題は以下のissueに集約されています。

github.com

2018からissueが上げられ、DHH本人がコメントする程に長く、クローズされた後も度々オープンされ直されていて、正直綺麗な解決策が完全に確立されているとは言えない問題な気がしています。

そもそも Master Key とは

以下はChatGPTがシンプルにまとめてくれた内容です。

Railsのmaster.keyとcredentials.yml.encは、アプリケーションの秘密情報を安全に管理するための仕組みです。

credentials.yml.encは、アプリケーションの秘密情報（APIキー、データベースのパスワードなど）を暗号化して保存するためのファイルです。このファイルは暗号化されているため、そのままでは中身を読むことはできません。

一方、master.keyは、credentials.yml.encの暗号化を解除するためのキーを保存するファイルです。このキーを使用することで、credentials.yml.encの中身を読み取ることができます。

Railsアプリケーションを運用する際には、master.keyは公開リポジトリにはアップロードせず、秘密に保つ必要があります。なぜなら、このキーが漏洩すると、credentials.yml.encに保存された秘密情報が第三者に読み取られる可能性があるからです。

これらの仕組みを使用することで、秘密情報をソースコードから分離し、安全に管理することができます。

特に変な話ではなく、今までsecrets.ymlという機密情報の管理場所をエンコードしたのがcredentials.yml.encであって、それを開けるために必要なのがmaster.keyです。

問題になるのが、今までデコードを意識した本番デプロイが不要だったのと、想定外の処理でこのmaster.keyが必要とされてしまっていることです。

Docker、クラウドサービスとRailsでのMaster Key管理の課題・問題

元々貼っていたissueにもあるように、そもそもこの問題が上がったのは、Railsアプリ起動時ではなくDockerでのrails assets:precompile実行時です。

今までであれば、Railsアプリ起動時のコンテナ内で機密情報読み込みだけを意識すればよかったところ、コンテナをビルドする際のassets:precompileという機密情報が本来不要な箇所で怒られるようになってしまいました。Issueでの回答は、「タスクは関係なく、常にmaster.keyが期待されるため、想定どおりの挙動」や、「assets:precompileと一緒にrakeコマンドで生成してしまえば良い」、「ダミーを入れれば行ける」など、ワークアラウンドがメインで、結果としても以下のような対処法になっています。

github.com

普通に、タスクベースでmaster.keyの強制を解除しつつ、ダミーキーを設定して実行するという方法です。

解決策とベストプラクティス...?

結論として、master.keyが本来不要なタスクに関してはダミーの設定とmaster.keyの強制を外せば物は動きます。直近GCPのcloud buildとcloud runで作ったいくつかのアプリでも、無事ビルド・デプロイを実施できていますし、GCPのsecret managerを使ってsecret_key_baseをも渡せています。

ただ、Out-of-the-box experienceとしては毎度ここを見落としてコードをいじっている気がしているため、これが解決策だとはわかりつつも常に悩みの種になっています。

まとめ

当たり前ですが、credentials.yml.encやmaster.key自体悪い物ではないですし、機密情報をエンコードすることで事前に防げる問題も多々あると思います。Rails 7.1からDockerでの開発がほぼ前提となる方向でも進んでいますし、今後こういったちょっとした不便・悩みが解消されて行くことは楽しみです。

明日の記事は marice0819 さんの『AIニュースコメンテーターの作りました (コメント評価)』話です。お楽しみに！

ECS で動く Web サーバーを安全に終了させる

2024-12-19T12:00:00+09:00

この記事はGunosy Advent Calender 2024の19日目の記事です。昨日の記事はskozawaさんの「第2回インフォメーション・ヘルスAWARDに参加しました」でした。

はじめに
ECS タスクの graceful shutdown
コンテナ間の依存関係を設定する
nginx コンテナの graceful shutdown
- 受信済みのリクエストの処理が完了している
- 新規リクエストが送られてこなくなっている
まとめ

はじめに

こんにちは、mtjuneです。サーバーサイドエンジニアとしてサービスの開発・保守を行っています。

もう7ヶ月ほど前の話になりますが、AWS OpsWorks が2024年5月にサービスを終了する*1ため、弊社ではOpsWorks上で動作していた一部のWebサーバーをコンテナオーケストレーションサービスである ECS(Elastic Container Service) に移行しました。

ECS 上では ECS タスクという単位でアプリケーションが動作しますが、この ECS タスクはデプロイ、スケールイン、Spot インスタンスの終了など、様々な要因で終了することがあります。

このとき終了処理を適切に行わないとリクエストの処理が途中で打ち切られたり、新規リクエストを受け付けられなかったりでクライアントに適切なレスポンスを返せなくなってしまいます。この終了処理をきちんと行う、というのが本記事の趣旨となります。

リクエスト処理中にアプリケーションが終了したときの図

ECS タスクの graceful shutdown

ECS タスクが終了される場合、コンテナに終了シグナル（SIGTERM など）が送信されます。ECS タスクのコンテナ内で動いているアプリケーションはこの終了シグナルを受けとってプロセスを終了させることになりますが、何も考えず即座に終了させると上述したように処理中のリクエストが打ち切られてしまう可能性があります。

そのため終了シグナルを受け取った後、

新規リクエストが送られてこなくなっている
受信済みのリクエストの処理が完了している

ことを保証して終了するようにしたいです（このことを graceful shutdown と言ったりします）。

また、今回のケースでは各 ECS タスクにサイドカーとして nginx コンテナを配置し、アプリケーションはこの nginx コンテナを通してリクエストを受け取るようにしています。そのためアプリケーションコンテナだけではなく、nginx コンテナも同じように graceful shutdown させる必要があります*2。

すごく雑な ECS タスク内の図

ではここから、graceful shutdown させるために今回行った設定を紹介していきます。

コンテナ間の依存関係を設定する

ECS ではコンテナ間の依存関係を指定することでコンテナの起動順を制御することができますが、終了順（各コンテナに終了シグナルを送信する順番）も制御してくれます。つまり、ここで「nginx コンテナ」を「アプリケーションコンテナ」依存するように設定すると、以下のような順番で処理が進みます

nginx コンテナに終了シグナルを送信
（nginx コンテナの終了後）アプリケーションコンテナに終了シグナルを送信

こうすることでアプリケーションコンテナの前段にいる nginx コンテナが必ず先に終了するため、nginx コンテナが graceful shutdown するようになれば自然とECSタスク全体も graceful shutdown するようになってくれます。

コンテナ間の依存関係は ECS タスク定義から設定できます。

タスク定義でコンテナ間の依存関係を設定する

nginx コンテナの graceful shutdown

次は nginx コンテナで graceful shutdown を行うことを考えます。

受信済みのリクエストの処理が完了している

受信済みのリクエストの処理が完了している ことについては、nginx は SIGQUIT シグナルを受けたときに残っているコネクションの処理を完了させてから終了するようになっていました。さらに nginx の公式 docker image では終了シグナルとして SIGQUIT を使うようになっていた*3ため、このイメージをベースイメージとしたnginxコンテナを作るだけで解決してしまいました。

新規リクエストが送られてこなくなっている

次に 新規リクエストが送られてこなくなっている ことについてですが、こちらに関しては ECS タスクへリクエストをルーティングしている側（Application Load Balancer や ECS サービスディスカバリなど）によって行うべき対応が変わると思います。

今回は ECS タスクへリクエストをルーティングするのに ECS サービスディスカバリを利用しており、TTL を 10秒に設定していたため終了シグナルを受けてから少なくとも10秒はリクエストが送られてくる状態でした。これに関しては単純にシェルスクリプトで「リクエストが送られなくなるのに十分な時間待機してから nginx に SIGQUIT を流す」処理を書いて対応することにしました。

#!/bin/sh

set -e

quit_after_wait() {
  # 20秒待機してから引数で指定されたプロセスに SIGQUIT を送る
  # $1: child_pid

  sleep 20
  # nginx に SIGQUIT を送る
  kill -s QUIT $1

  wait $1
  exit $?
}

# nginx プロセスを開始
/usr/sbin/nginx &
# nginx のプロセス番号を child_pid に保持
child_pid=$!

# SIGQUIT を受け取ったときに quit_after_wait を実行するように設定
trap "quit_after_wait $child_pid" SIGQUIT

wait ${child_pid}
exit $?

まとめ

この記事では ECS タスクで Web サーバーを動かすにあたり、適切に graceful shutdown させるために行った設定を紹介してきました。この記事では非常にざっくりとした内容しか書いてないので、より詳しい解説を読みたい方は AWS から出ている記事を読んでもらうのが良いと思います。

aws.amazon.com

明日の Gunosy Advent Calendar 2024 はサンドバーグさんの「クラウドサービスとRails 7: Master Keyの管理で何故か沼るのは自分だけ？」です。

*1:https://docs.aws.amazon.com/ja_jp/opsworks/latest/userguide/stacks-eol-faqs.html

*2:アプリケーションコンテナが動いていても、nginx コンテナが終了すると新規リクエストを受けられなくなる

*3:https://qiita.com/ynd/items/62ec382c69fb45710cb6

第2回インフォメーション・ヘルスAWARDに参加しました

2024-12-18T11:58:33+09:00

こんにちは。 id:skozawa です。

こちらの記事は Gunosy Advent Calendar 2024 の 18 日目の記事です。昨日は吉岡さんの僕がエンジニアリングマネージャーとしての迷いから抜け出した 3 つの心がけでした。

12 月 13 日（金）に第 2 回インフォメーション・ヘルス AWARD の表彰式、シンポジウムがあり、私はアイデア部門の選考委員として参加させてもらいました。詳細なレポートは後日、NHK 財団さんから配信されると思いますので、今回は参加した感想などを簡単に書きたいと思います。

www.media-literacy-nhkfdn.jp

インフォメーション・ヘルスとは
表彰式・シンポジウム
アイデア部門の選考
まとめ

インフォメーション・ヘルスとは

「インフォメーション・ヘルス（情報的健康）」とは、私たちが日々接する情報の質やバランスを適切に保つことで、健全な情報環境を維持しようとする考え方です。これは、東京大学の鳥海不二夫教授や慶應義塾大学の山本龍彦教授らが提唱しています。

この概念は、食生活における栄養バランスに例えられます。好きなものばかり食べていると体の健康が損なわれるように、偏った情報ばかりを取り入れると「情報の偏食」となり、フェイクニュースや誹謗中傷の拡散などにつながるとされています。

情報的健康を維持するためには、以下の点が重要とされています。

多様な情報源に触れる: 特定の意見や視点に偏らず、さまざまな情報に接することで、バランスの取れた視野を持つことができます。

情報の信頼性を確認する: 情報の出所や根拠を確認し、誤情報やフェイクニュースに惑わされないようにすることが求められます。

情報リテラシーの向上: 情報を正しく理解し、適切に活用する能力を高めることが、健全な情報環境の構築につながります。

これらの取り組みを通じて、個人や社会全体の情報的健康を守り、健全な言論空間を維持することが目指されています。

生成 AI に解説してもらいました。情報過多の現在、フィルターバブルやエコーチェンバーなどの様々な課題があり、情報摂取のあり方についても考える必要があるという内容です。詳しくは以下の共同提言をご覧ください。

共同提言「健全な⾔論プラットフォームに向けて ver2.0 ―情報的健康を、実装へ」

表彰式・シンポジウム

会は以下のような流れでした。

表彰
アイデア部門のシンポジウム
基調講演
第 1 回社会実装報告
社会実装部門のシンポジウム

シンポジウムでは受賞者と選考委員の方たちが登壇し、受賞作品やインフォメーション・ヘルスについて議論しました。私もアイデア部門のシンポジウムに参加させていただき、簡単ながら受賞作品へのコメントや議論に参加させてもらいました。

また、第 1 回グランプリの心組成計の社会実装に関する報告がありました。心組成計は 12 の設問に回答すると、ネット環境で個人が陥りやすい「タガの外れ」具合が数値化されます。アイデアの社会実装が進んでおり、利用者のデータを分析した結果が報告されました。グランプリ作品が実際に実装されるのはインフォメーション・ヘルス AWARD の素晴らしいところだなと感じました。

第 1 回 IHA グランプリ作品『心組成計』トライアル

基調講演では国際大学の山口先生から、誰もが情報が発信できる「人類総メディア時代」についてお話がありました。 SNS での誹謗中傷の話や、ネット世論はサイレントマジョリティーの意見が隠れてしまい本来の分布とは異なることなど、参考になる話が多くありました。

president.jp

アイデア部門の選考

今回、私はアイデア部門の選考委員として参加させてもらいました。 100 件程度の応募作品の中から優秀だと思うものを選定しました。

初めての参加だったということもありますが、応募作品のアイデアは多様で面白いアイデアも多かったため、どういう基準でどのように選考するかを迷いました。アイデア部門の選考委員の中で技術者は私だけだったため、技術的な観点も考慮に入れつつ、体験を変える力がありそうかという観点を中心にいくつかの観点からアイデアを評価をさせてもらいました。基調講演で山口先生から、「気づき」を与え「行動変容」へ、という話もあり、改めてこの観点の大事さを感じました。

当然ながら私一人の評価で受賞が決まるわけではなく、選考委員の皆様との選考委員会を通じて受賞作品は決まります。選考委員会での議論もシンポジウム同様に深い議論になり興味深く参加させていただきました。

まとめ

第 2 回インフォメーション・ヘルス AWARD に選考委員として参加させてもらいました。今年はアメリカ大統領選や兵庫県知事選など、SNS の情報が大きく世論に影響を与える出来事が印象的な年になりました。選考委員会やシンポジウムを通じて、情報を扱う重要性や難しさを改めて感じるとても良い体験となりました。

明日の記事は mtjune さんの ECS で動く Web サーバーを安全に終了させる話です。お楽しみに！

僕がエンジニアリングマネージャーとしての迷いから抜け出した 3 つの心がけ

2024-12-17T10:30:00+09:00

こんにちは。アプリチームマネージャーの吉岡 ( rikusouda ) です。

これは Gunosy AdventCalendar 2024 の 17 日目の記事です。16 日目の記事は miyagi さんの QAのバグトラッキングで大切なことでした。

2 年間のエンジニアリングマネージャー経験からいろいろ迷う場面がありましたが、それらを解消した 3 つの心がけを紹介します。

エンジニアリングっぽい写真

はじめに
迷いから抜け出した 3 つの心がけ
最後に

はじめに

2022 年の秋、僕は「エンジニアリングマネージャー」という新たな挑戦に直面しました。それまで約 20 年間エンジニアとしてキャリアを積み、特に iOS 開発では 5 年の経験がありましたが、マネージャーの役割は未知の世界でした。「どこまで自分で手を動かすべきか」、「メンバーの仕事にどの程度介入すべきか」など、これまでに経験したことのない迷いに直面しました。

この記事では、僕がその迷いから抜け出した 3 つの心がけを共有します。

迷いから抜け出した 3 つの心がけ

マネジメントに関する本を読んだ際、「マネージャーの成果はチームの成果と、自分が関わる周りのチームの成果の合計である」という考え方に出会い、それが大きな転機となりました。この視点を通じて、マネージャーとしての役割が自分の中で腹落ちしました。

さらに読書をすすめる中で、下記の 3 つの心がけが僕の迷いを解消したことに気が付きました。

1. チームの成果に責任を持つ : 任せることと丸投げの違い
2. 自分個人ではなくチームで活躍する
3. チームの雰囲気を育む

1. チームの成果に責任を持つ : 任せることと丸投げの違い

マネージャーの役割は、チームの成果を最大化することです。そのためには、メンバーに任せられる部分は積極的に任せつつ、必要な場面でしっかりと関与するバランスを取ることが重要です。

任せる際には、次の問いを自分に投げかけます。

この人の意思決定に自分が責任を持てるか
自分が関与しない場合にどのような結果が予想されるか

例えば、ある施策で事前分析が不足していた際、僕は「レビューで気づけなかった自分の責任」と考えました。その経験を踏まえ、以降は施策実施前に追加調査を依頼するようにし、成果の確実性を高めました。

こうした視点を持つことで、メンバーの仕事に対しての関わり方が見えてきました。

2. 自分個人ではなくチームで活躍する

僕が意識しているのは、「メンバーが成果を上げることを喜べるマネージャー」であることです。挑戦しがいのある課題があるとき、自分で解決したい気持ちを抑えメンバーに任せることで成長を支援します。

基本スタンスとして、自分で書いたコードよりもメンバーの書いたコードのほうがマネージャーにとって、チームにとって価値の高いものと考えます。

僕が手を動かすときは、チーム全体の成果を守るためです。例えば、グノシーアプリのリファクタリングでは、内部コードの理解を深める目的もあり、実装タスクを事前に一つ引き受けました。これにより、リファクタリング計画の精度が上がり、チーム全体の生産性も向上しました。こうした状況で手を動かすことは、チーム全体の成果を守るために重要です。

3. チームの雰囲気を育む

チームの雰囲気は、成果に直結する重要な要素です。特にリモートワークが主流の今、コミュニケーションのハードルを下げる工夫が欠かせません。

僕が採用した方法の一つが「パーソナリティを開示する自己紹介」です。以下のポイントを盛り込み、チームの壁をなくすことを意識しました。

学生時代の写真 : 親近感を生む
家族や趣味の話 : プライベートな一面を共有
過去のプロジェクト経験 : 専門性を示す

これにより、メンバー同士のコミュニケーションのハードルが下がり、結果的にチームの雰囲気が柔らかくなったと感じています。メンバーによっては公開したくないプライベートもあると思うので公開を強制しませんが、マネージャーが先に自己開示することでメンバーの自己開示のハードルを下げるようにしました。

自己紹介シートの一部

※この方法は僕が Gunosy に入って最初に所属した LUCRA チームの自己紹介フォーマットを参考に、自チームで復活させました

最後に

僕がエンジニアリングマネージャーとして何もわからなかったところから、試行錯誤していく中で得た心がけを紹介しました。その心がけが、マネージャーとしての僕の判断軸となっています。

かっこいいことを書きましたが、その心がけを完全に体現するには自身のスキルアップの必要性も感じています。

この記事が、マネージャーとして迷いを持つ方や、今後エンジニアリングマネージャーになることを視野にいれる人の参考になれば幸いです。

明日は id:skozawa さんの第2回インフォメーション・ヘルスAWARDに参加しましたです。

QAのバグトラッキングで大切なこと

2024-12-16T12:00:00+09:00

こんにちは。QA チームの miyagi です。
この記事は Gunosy Advent Calendar 2024 の 16 日目の記事です。
昨日の記事は igtm さんの「LLM を用いた PDF を元にした回答と、該当箇所のハイライト」でした。

今回は開発と QA におけるバグトラッキングについての記事となります。

はじめに
Gunosy のバグトラッキングについて
- バグのワークフローと JIRA を利用した管理
- ワークフローの詳細
バグトラッキングで重要なポイント
まとめ

はじめに

Gunosy ではバグトラッキングシステム (BTS) として JIRA を活用しています。
今回は Gunosy でのバグトラッキングのワークフローの紹介と、BTS を運用して重要だと感じたポイントや、適切なバグトラッキングによって得られたメリットについて書きたいと思います。

Gunosy のバグトラッキングについて

バグのワークフローと JIRA を利用した管理

Gunosy の各プロダクトの QA 工程で、バグが起票されてから Close するまでのワークフローは下の図の通りです。

バグトラッキングのワークフロー

Gunosy の各プロダクトの QA 工程では多くのバグチケットが起票されますが、
JIRA のカンバンボードをプロダクト毎に分けて管理することで、現在の対応状況が把握しやすくなっています。
ワークフローとカンバンボードの列が一致するように設定しています。

JIRAのカンバンボード

上の画像は QA 工程が完了後の状態のスクリーンショットで、全てのバグチケットが Close の状態となっています。

ワークフローの詳細

[OPEND] バグの起票

テストで見つかったバグを JIRA に起票すると、ステータスは OPEND となります。
QA のテスト開始以降に発見されたバグは必ず BTS に登録してから修正する運用ルールとなっているため、
バグチケットの起票は QA メンバーに限らず、開発エンジニアが行うこともあります。
新規に起票されたバグは該当するプロダクトの Slack のチャンネルに通知され、開発・QA メンバーが確認できるようにしています。
[ASSIGNED] バグの担当者への割り当て・修正対応

バグチケットを Open した時点では担当者の指定は行わず、
開発の担当領域に応じてエンジニアが各自で担当するチケットを自分にアサインして、ステータスを ASSIGNED に変更する運用としています。
担当のエンジニアによって対応が完了したバグチケットは次の RESOLVED のステータスに変更されます。
[RESOLVED] バグの修正確認

RESOLVED に変更されたチケットはバグを起票した QA メンバーにアサインされ、修正確認のテストを実施します。
バグが再現する場合には、修正を担当したエンジニアに再アサインを行い、ステータスは ASSIGNED に戻ります。
[CLOSED] バグチケットの完了

修正確認で問題がなかった場合、QA メンバーがチケットを CLOSED のステータスに変更します。
今回のリリースで修正対応をせず、次回以降のリリースに持ち越すバグについても、チケットにその旨コメントを記載して Close します。
見送りのバグは定期的に棚卸しを実施し、修正時にはエンジニアがチケットを ReOpen します。
ワークフローの制限

JIRA で開発メンバーと QA メンバーに異なる権限を設定しており、ワークフローに以下のような制限を設けています。
・QA メンバーの権限ではチケットを Resolve できない
・開発メンバーの権限ではチケットを Close できない
・各ステータスにてバグチケットの必須の項目が未入力になっている場合はワークフローの遷移ができない
このように細かな制限を付けておくことで、イレギュラーな運用ができないようになっています。

バグトラッキングで重要なポイント

QA でバグトラッキングを行っている中で重要だと感じたポイントや、得られたメリットを以下に挙げます。

バグ対応の進捗状況をトラッキングすること
BTS の名前の通り、バグの状況をリアルタイムで追跡できていることが大切です。
バグチケットのステータスを常にアップデートしておくことで、各バグチケットの Open から Close までの進行状況をモニターでき、開発・QA を含め関係者全員がバグの進捗を把握できるようになることで、放置されるバグがなくなります。
また、JIRA のカンバンボードを利用することで、現在のチケットの担当者とステータスを簡単に把握でき、MTG でカンバンボードやチケットを見ながら相談したり、コミュニケーションのサポートになっています。
バグチケットの内容を明確にすること
全体のワークフローに加えて、各バグチケットの内容を詳細にしておくことも重要だと感じます。
開発エンジニアが原因の特定や調査をしやすくなるように、再現手順や期待結果と実際のテスト結果など基本的な情報はもちろん、再現率が低いバグの場合などは可能な限り多くの情報を記載するようにしています。
バグチケットの内容が明確になっていると開発と QA 間のコミュニケーションがスムーズになるため、バグの再現や修正対応を効率的に進めるためには必要な情報が正しく記載されていることが大切です。
対応履歴を残し、バグを蓄積させること
バグチケット上で確認内容や対応の履歴を残すことも重要なことの1つです。
バグチケットの各フィールドを適切に設定しておくことで、QA 工程が完了してアプリのリリースから時間が経っても各バグの対応履歴が確認でき、品質向上のためのバグ分析に活用できるようになります。
具体的には、JIRA のカスタムフィールドを利用して以下の内容を設定するようにしています。
- バグの起票時にバグ報告者が入力する項目
  - バグのタイプ:
    - 機能不全、UI/UX の問題、ログの問題、クラッシュなど
  - バグを発見した方法:
    - テストケース実行、Ad-hoc テスト、自動テストなど
  - バグの重要度:
    - 「必ず解決すべき」レベルから「解決しなくても良い情報提供」のレベルまで、4 段階から選択
- 開発エンジニアが対応完了時に入力する項目
  - バグの解決方法:
    - 修正対応済み、修正を行わない、仕様通りの挙動、次回以降のリリースに対応を持ち越しなど
  - バグの原因:
    - コード上の問題、仕様に関する問題、外部コンポーネントの問題、環境に起因する問題など

起票されたバグチケットが BTS に蓄積されることで、バグのデータベースが作られます。
バグの DB ができることによって、過去のバグの検索や、データをエクスポートして集計・分析ができるようになります。
QA チームでは蓄積されたバグチケットを活用し、バグの発生傾向について分析を行い、開発チームとともにプロダクトの品質向上に繋げられるように取り組んでいます。

まとめ

今回はバグトラッキングについて、ワークフローと重要なポイントについて紹介しました。
バグの管理は QA においては基本的な事柄でありながら、最も大切な事柄でもあると思います。今後も適切に運用して品質改善に繋げていきたいと思っています。

明日の Gunosy Advent Calendar 2024 では、吉岡さんが「僕がエンジニアリングマネージャーとしての迷いから抜け出した 3 つの心がけ」についてお話します。お楽しみに！

LLM を用いた PDF を元にした回答と、該当箇所のハイライト

2024-12-15T08:00:00+09:00

こんにちは。新規事業開発室の igtm です。

こちらの記事は Gunosy Advent Calendar 2024 の 15 日目の記事です。

本記事では、LLM を用いた PDF を元にした回答と、該当箇所のハイライトの話を書きたいと思います。

ウデキキとは

ウデキキとは、用途別にカスタマイズされた「スキル」を通してChatGPTなどの生成AIに文章を生成させることが出来るWebサービスです。今回はその中の「PDFリサーチアシスタント」というスキルを実装する上で工夫した ①回答の根拠の引用と②該当箇所のハイライトについて説明したいと思います。

PDFリサーチアシスタントスキルの実際の動作画面

① 回答の根拠の引用

LLMにとあるソースの内容に基づいて回答をしてもらう手法の一つとしてRetrieval-Augmented Generation (RAG)があります。「PDFリサーチアシスタント」スキルにもRAGを使って実装していますが、RAGを使う上で具体的にどの文章を引用してその回答をしたかを出す必要がありました。

具体的には、SystemPromptに回答と共に参考にした文章の引用キー(例えば [PDFのID-チャンクのID] など) を付けるように指示をして、更に質問の入力時にRAGでヒットした文章と引用キーを渡してあげると、出力でLLMが回答の参考にした引用キーが付いて返ってるようになります。

質問

1920年から2020年まで人口はどれだけ増えましたか？

Sources:
1-32: 1920年   55,963,053   28,044,185 ...
1-42: 2020 年 10 月１日現在における我が国の人口は１億 2614 万６千人。...

回答

1920年の人口は55,963,053人で、2020年の人口は126,146,099人でした。
したがって、この期間で人口は70,183,046人増加しました [1-32]

②該当箇所のハイライト

①により、どの部分を参考に回答したかがLLMから出力されるようになりました。次に、出力された引用キーがPDFのどの箇所かをハイライト表示してユーザーにわかりやすく表示します。「PDFリサーチアシスタント」スキルでは、PDFの解析に Azure Document Intelligence*1 の layout model を使用しています。

learn.microsoft.com

これにより、OCR した文字情報と共に、位置情報（polygon*2）を取得することができます。そして、RAGに利用するチャンクと位置情報を紐付けて利用することで、ハイライトするべき位置情報を算出することができるため、その情報をPDFに渡すことでハイライトができるようにしました。

polygon の情報を利用する

その他工夫点

Chunking の手法

単純な文字数によるChunking だと表が途中で切れてしまって意味のあるチャンクにならない問題があります。そこで MultiVectorRetriever を採用し、表だけを１つのチャンクにすることで正しい結果が返せるようにしました。また表の文字列は数字の羅列のためそのままベクトル化しても質問文にHitしないことが多いため、一度LLMに要約させた文章をEmbeddingにすることでより質問文にHitするように工夫しました（MultiModal RAG）。

Azure Document Intelligence のOCR結果画面

まとめ

プロンプトで引用キーを付けるように指示するとしっかりこちらの意図通りに返答してくれるのがかなり驚きました。検証中、様々なモデルで検証しましたが、やはり上位のモデルになればなるほど高い認識力で回答してくれました。ただし100%ではないのでエラー時の処理やモデルやプロンプト別の定量評価などは少し苦労したので今後の課題ではあります。

明日の Gunosy Advent Calendar 2024 では miyagi さんが「QAのバグトラッキングで大切なこと」についてお話します。お楽しみに！

参考文献

*1:https://azure.microsoft.com/ja-jp/products/ai-services/ai-document-intelligence

*2:polygon の単位はインチであることに注意。

QuickSight に入門してみた

2024-12-14T10:00:00+09:00

こんにちは。ML チームの大城（k.oshiro）です。

こちらの記事は Gunosy Advent Calendar 2024 - Adventar の 14 日目の記事です。 13 日目の記事は森田さんの Headful な Selenium を Lambda で動かしたい - Gunosy Tech Blog でした。

この記事は QuickSight について学んだことのアウトプットブログとなります。

私は、これまでの業務上で QuickSight を使用する機会があまりなかったため、ほとんど知識がない状態でした。しかし、最近は ML チームの業務で QuickSight を使用・編集する場面が何度か生じていました。そこで QuickSight の理解を深める必要を感じ、その概要やデータセット、分析について API リファレンスを読んで学び、入門することにしました（記載内容は公開時点までのものになります）。

QuickSight とは？

QuickSight は、AWS が提供するビジネスインテリジェンス（BI）サービスです。S3 や Athena などのデータソースから得た情報を一元化し、効果的に可視化することができます。

QuickSight のデータセット

QuickSight では、データソースから得た情報をテーブルに変換して扱います。データセットには、都度取得するものとインメモリに格納するものがあり、インメモリ計算エンジンの Spice を使用すると、Spice にデータを取り込むことで都度データソースからデータを取得せずともよくなります。

データセットには Physical table map と Logical table map 、そして、Output columns が定義されています
- Physical table map
  - Custom SQL、RelationTable、S3Source の 3 つ
    - 弊社では Athena のクエリ結果を元に Spice を作成しているため、データセットは RelationTable で宣言されています
    - RelationTable は Catalog や Schema、InputColumns などの情報を持っています
- Logical table map
  - カラムのキャスト（CastColumnTypeOperation）や計算カラム（CreateColumnsOperation）、行のフィルター（FilterOperation）などが定義されています
- Output columns
  - 分析などで使用するためのカラムが定義されています
Spice にデータを取り込むために発行したクエリは Athena から確認することが可能です
- データ取り込みが失敗した際に、発行されたクエリを確認することでエラー解決の手がかりとなりそうです

QuickSight の分析

QuickSight の「分析」は、特定ユーザーだけがアクセス可能なダッシュボードの編集機能です。

分析画面

分析を公開するとダッシュボードとして表示できるようになります。分析では、シートとビジュアルの 2 つの構成要素を使用してデータを分析&可視化します。弊社のシートとしては、 A/B ダッシュボードの中に GunosyAds シートと Gunosy Network Ads シートというように使われていました*1。ビジュアルとしては、売上データを棒グラフで表示するなどの使い方があります。

DatasetIdentifierDeclarations、CalculatedFields、ColumnConfigurations などがあります
CalculatedFields（計算フィールド）
- 分析上で追加するカラムの設定です
- その分析でのみ使用でき、データセットには取り込まれません
- データセットの時点で追加できる計算フィールドもあります
  - この場合、そのデータセットを使用するすべての分析で、その計算フィールドを使用することができます
FilterGroups
- 分析画面の Filter から追加でき、どのようなデータを抽出するかを決定します
- これはシートの FilterControls から参照されます

シート

シートは複数のビジュアル（グラフなど）を 1 つにまとめたものを指します。これは 1 つの分析に複数配置することができます。

シート画面

シートには ContentType、FilterControls、Layouts、Visuals などが定義されています
Layouts 系はその名の通りレイアウトに関するものです
Controls 系
- FilterControls
  - Analysis の FilterGroups をシートで使用できるように宣言しています
- ParameterControls
  - Analysis で設定したパラメータをシートで使用できるよう宣言しています
Visuals
- シートを構成する各グラフが入っています

ビジュアル

1 つのグラフのことを指します。棒グラフや折れ線グラフ、テーブルなどが使用できます。

ビジュアル画面

グラフの種類の分だけ定義があり、BarChartVisual、BoxPlotVisual などが宣言できます
例として BarChartVisual を見ます
- ChartConfiguration、ColumnHierarchies、Title、Action などがあり、そのグラフの種類に応じた情報を持っています
- ChartConfiguration はグラフの x 軸や y 軸、カラーラベルなどが定義できます
- Action では、グラフのデータ点をクリックすることをトリガーに、色々なことが行えるように設定できます
  - 例. データ点をクリックするとパラメータを設定する（SetParametersOperation）、フィルタを行う（FilterOperation）など

終わりに

今回の学習を通じて、QuickSight の基本的な概念や機能について理解を深めることができました。また、API リファレンスを見ることでデータをどのように保持しているのか、何が必要なのか、どこがどのように関連しているのかを知れたので、この入門の仕方はなかなか良いと感じました。

明日は igtm さんの「LLM を用いた PDF を元にした回答と、該当箇所のハイライト」です。お楽しみに！

参考にした資料

データセット
- DataSet - Amazon QuickSight
分析
シート
- SheetDefinition - Amazon QuickSight
ビジュアル
- Visual - Amazon QuickSight

*1:Gunosy Network Adsは終了したため現在は使用されていません

Headful な Selenium を Lambda で動かしたい

2024-12-13T09:50:36+09:00

こんにちは。Gunosy R&D チームの森田です。

こちらの記事は Gunosy Advent Calendar 2024 の 13 日目の記事です。昨日の記事は koizumi さんの Aurora I/O-Optimized で RDS のコストを削減した話でした。

Headful (headless でない) Selenium (Chrome) を AWS Lambda で動かそうと思ったら、思ったよりも大変な話だったのでまとめておきたいと思います。LLM を使ったアプリケーションを構築していると、ユーザの指定するページのテキストやスクリーンショットを取得して、要約や質問応答など指示された処理の結果を返すような場合等、Selenium を動かしたくなる状況が多々あると思います。現在の Web はユーザーからは一見分かりにくいもののかなりのページが動的に作られるため、RAG のように事前にどんな Web ページを見に行くか分からない状況では、 Selenium のようなブラウザ自動操作が必要となってきます。

Selenium

その時に Headless Chrome を使う選択肢もあるのですが、Headless モードで動かした時に表示に差が生じてしまうのを避け、人が開いた時に見える Web ページをなるべく再現度高く表示するためには、人が操作するのと同様にブラウザを動かす Headful なモードの方が意図せぬ差を減らすことができます。

LLM アプリケーションは事前にどの程度の頻度で使われるか想定が難しいことが多く、作ってみたもののあまり使われないというパターンもありがちです。いつどのくらいリクエストが来るかわからない状況では、固定のコストを避けアクセスが集中しても耐えられる点で AWS Lambda で手軽に動かせるようにしたいです。

というわけで、Headful な Selenium を Lambda で動かす方法についてまとめていこうと思います。

結論
環境構築
まとめ

結論

さて、結論からいいますが docker-selenium-lambda を使いましょう

github.com

リポジトリ中のサンプルのスクリプト main.py では Chrome のオプションとして --headless=new を指定していますが、この docker イメージのままで --headless オプションを与えなくとも動作するようになっています
これをベースに、後述する日本語フォントをインストールしておくとよさそうです

環境構築

ここまでで伝えるべきことの 90％くらいは説明してしまったのですが、完成品だけをみてもどうしてそうなっているのかが分からないと応用がしにくいこともあります。この先はもう少し細かい環境構築の説明をしていきます。

Chrome のインストール

Selenium を安定して動作させるためには、Chrome と Selenium の WebDriver のバージョンを合わせ、かつ Selenium の動作が不安定なバージョンを避ける必要があります。Selenium には Selenium Manager という適切な Chrome とドライバを選んでダウンロードする機能が備わっていますが、実行時にブラウザ・ドライバが見つからなかった時にはじめて実行されるため、通常永続ストレージを持たない Lambda とはあまり相性がよくありません。やはり、docker-selenium-lambda のようにイメージにブラウザ・ドライバを含めてしまう方が扱いやすいでしょう。ここで選択されているバージョンはテスト済みのものが選択されているため、第一選択肢としてそのまま使わせていただくのが安全です。継続的にバージョンを更新しつづける場合や、最新版以外も利用したい場合には Chrome for Testing availability から利用可能なバージョン、ダウンロード URL を取得するのがよいでしょう。

Headful にするために

AWS Lambda にはディスプレイがありませんので、そのままでは --headless オプション無しでは動作しません。そこで、Xvfb という仮想ディスプレイサーバを利用します。Xvfb は X (Linux 等で使われる GUI を動かすための基盤) の仮想版で、マウスやキーボード、モニタなしで動作し、ソフトウェア側はディスプレイに表示されているのと同様に動作することができるようになります。
xvfb 自体のインストール
- xorg-x11-server-Xvfb と X に関連するパッケージ
pyvirtualdisplay python パッケージ
- pip install pyvirtualdisplay
- Lambda 環境で動作させるには起動時に '-nolisten inet6 -nolisten unix' オプションが必要
  - 後でお見せするサンプルスクリプトで使われている-maxbigreqsize オプションは長大なページを表示しようとしてメモリが不足する場合に

日本語フォント

標準のままでは日本語が豆腐（􏿮）になるため、レイアウトも崩れ、スクリーンショットを撮影する場合には不都合です。 Amazon Linux 2 であれば下記パッケージを yum でインストール

yum install -y ipa-gothic-fonts ipa-mincho-fonts ipa-pgothic-fonts ipa-pmincho-fonts

Amazon Linux 2023 の場合は IPAフォントがリポジトリにないため、noto フォントが最も手軽にインストールできます

dnf install -y  google-noto-emoji-color-fonts google-noto-emoji-fonts google-noto-fonts-common google-noto-sans-fonts google-noto-sans-jp-fonts google-noto-sans-gothic-fonts google-noto-serif-fonts google-noto-serif-jp-fonts

サンプルスクリプト

さて、docker-selenium-lambda の main.py をベースに Headful で動くコードを見てみましょう。差分は pyvirtualdisplay の呼び出し部分と--headless=new のオプションが無い所です。

from selenium import webdriver
from tempfile import mkdtemp
from selenium.webdriver.common.by import By
from pyvirtualdisplay import Display


def handler(event=None, context=None):
    options = webdriver.ChromeOptions()
    service = webdriver.ChromeService("/opt/chromedriver")

    options.binary_location = '/opt/chrome/chrome'
    options.add_argument('--no-sandbox')
    options.add_argument("--disable-gpu")
    options.add_argument("--window-size=1280x1696")
    options.add_argument("--single-process")
    options.add_argument("--disable-dev-shm-usage")
    options.add_argument("--disable-dev-tools")
    options.add_argument("--no-zygote")
    options.add_argument(f"--user-data-dir={mkdtemp()}")
    options.add_argument(f"--data-path={mkdtemp()}")
    options.add_argument(f"--disk-cache-dir={mkdtemp()}")
    options.add_argument("--remote-debugging-port=9222")

    with Display(
            backend="xvfb",
            visible=False,
            size=(1280, 1696),
            extra_args=[
                "-nolisten",
                "inet6",
                "-nolisten",
                "unix",
                "-maxbigreqsize",
                "127",
            ],
    ):
        chrome = webdriver.Chrome(options=options, service=service)
        chrome.get("https://example.com/")

    return chrome.find_element(by=By.XPATH, value="//html").text

Chrome のオプション

Chrome の起動オプションには、どうやら公開されている公式のドキュメントが無いようです。おそらく最も詳細な Chrome 起動オプションの一覧である List of Chromium Command Line Switches « Peter Beverloo には脅威の 1578 件 (2024/12/9 現在) ものオプションが記載されています。

こうなると、ドキュメントを読んで必要なオプションを選ぶ正攻法は難しいため、過去の魔術書から使えそうな呪文をコピペして試すことになります。この記事もその魔術書の一つとして役に立つことを願います。

Chrome のオプションは Headful でも大きくは変わらず --headless オプションを除くだけですが、ざっくりとした解説を残しておきます。

AWS Lambda で動かすために必要なオプション

AWS Lambda で動かすには、どうしても外せないオプションと状況次第では外せるオプションがあります。

必須となるオプションは以下のものです。このオプションを付けないと起動自体難しいでしょう。
- --no-sandbox
- --disable-gpu
- --single-process
- --disable-dev-shm-usage
推奨されるオプションは以下のものです。外すことも可能ですが、付けておいたほうが安定します。
- --no-zygote
  - zygote は Chrome のプロセスのコピーを担当しているが、Lambda 環境では役目がなく、かえって zygote のプロセスが増える分適切に終了しなかった時にゾンビプロセスが増える要因となる
  - オプションを与えなくても動かないわけではないが、無効化することでゾンビプロセスが発生するのを防げる
- --user-data-dir={mkdtemp()}
- --data-path={mkdtemp()}
- --disk-cache-dir={mkdtemp()}
  - 変なディレクトリに書き込もうとしてエラー終了することを防ぐ
- --disable-dev-tools
- --remote-debugging-port=9222
  - ローカル実行する際などは外したほうが良い場合もある
- --window-size=1280x1696
  - 値は用途、環境により自由に変更する（その場合、Xvfb の起動時のオプションも変更する）
余談: --single-process を外したい（が AWS Lambda ではどうやら難しい）
- Chrome は新規プロセスに対して権限を制限しようとするが、Lambda ではその権限が与えられないためエラーが起こる
- おそらく Lambda も Chrome も seccomp で権限を制限しようとしてそれが衝突している
  - seccomp: Linux のプロセスが利用できるシステムコールを制限する仕組み
- そうすると --no-sandbox や --disable-setuid-sandbox , --disable-seccomp-filter-sandbox などのセキュリティ関連のオプションで無効化できそうに思えるが、残念ながらそうはならないらしい
- このあたりの議論が出典
  - https://groups.google.com/a/chromium.org/g/headless-dev/c/qqbZVZ2IwEw/m/qOoNb73gAwAJ?pli=1
- まれに--single-process が特定のページを表示できない要因となる場合がある（ページを開こうとすると処理が重いのか固まってしまう）ため、そのようなページをどうしても扱う必要がある場合は Lambda の利用は諦め、EC2 などで動かす必要があります。

まとめ

ここまで、Headful な Selenium を Lambda で動かすための環境構築を解説してきました。LLM アプリケーションの構築で、ハマり続けたので、これから Selenium を動かそうとする方の助けになれば幸いです。

明日は k.oshiro さんの QuickSight に入門してみたです。お楽しみに！

Aurora I/O-OptimizedでRDSのコストを削減した話

2024-12-12T09:00:00+09:00

この記事はGunosy Advent Calender 2024の12日目の記事です。昨日の記事はUTさんの「EM（エンジニアリングマネージャ）になって１年半経った振り返り」でした。

はじめに
移行後のコスト削減結果
Aurora I/O-Optimizedとは
Aurora Standardの課金体系について
Aurora I/O-Optimizedによるコスト最適化
切り替え方法
移行の際の注意点
- 本番環境でそこまで安くならない場合がある
- 移行に関して幾つかの制約事項がある
おわりに

はじめに

こんにちは、koizumiです。去年はSREチームに在籍しておりましたが、今年からサーバーサイドチームでAPI開発やクラウドインフラの運用改善などを担当しています。

弊社ではAWSをはじめとしたクラウドインフラのコスト最適化に取り組んでおり、その一環としてAurora I/O-Optimizedを用いてRDSのコスト削減を行いました。本記事では、Aurora I/O-Optimizedの概要と、移行後のコスト削減結果、移行の際に気を付けるべきポイントについてご紹介します。

移行後のコスト削減結果

まずは、Aurora I/O-Optimizedに移行してどれくらいのコスト削減効果があったかをご紹介したいと思います。

以下は、RI購入料金を除いたRDSの直近6ヶ月の費用のグラフになります。

Aurora I/O-Optimizedへの移行とRIの追加購入により、8月まで右肩上がりであったRDSのコストをおよそ半額以上削減することができました。

RDS全体での削減結果

また、移行対象に限って見てみると、90%超のコストを削減することができました。

移行対象のみの削減結果

Aurora I/O-Optimizedとは

Aurora I/O-Optimizedは、Amazon Auroraの新しいストレージオプションで、高いI/O集中型のワークロードにおいてコストパフォーマンスを向上させることができます。このストレージオプションにすることで、Aurora DBクラスターへのI/O操作に対する追加料金が発生しないようになります。（料金体系の詳細については後述しています）

aws.amazon.com

以前は、Amazon AuroraのストレージオプションはAurora Standardのみの提供となっていたため、Auroraを使用する際はI/Oのコストが一定かかってしまうのは許容しなければいけないという状況でした。

Aurora Standardの課金体系について

Aurora I/O-Optimizedの詳細に入る前に、従来のストレージオプションであるAurora Standardの課金体系についておさらいしておきましょう。

Aurora Standardでは、毎月GBあたり$0.12のストレージ料金に加えて、I/O費用は100万リクエストあたり$0.24が請求されます。

aws.amazon.com

そのため、前述のように以前まではI/Oリクエストが多いワークロードに関しては一定のコストがストレージ料金に上乗せされてしまう状況となっていました。

Aurora I/O-Optimizedによるコスト最適化

Auroraにおいては、前述のようにI/Oリクエストによるコストの増加が大きな課題点としてありましたが、それがAurora I/O-Optimizedによってコスト最適化ができるようになりました。

以下の料金表は、Auroraの料金ページから引用してきています。

表から分かるように、Aurora I/O-Optimizedではストレージ料金が毎月のGBあたり$0.27（Aurora Standardと比較して約2.25倍）に増加する代わりに、その利用料金にI/O料金が含まれる形となります。（I/O料金が実質無料になると考えて良いでしょう）

ストレージ料金とI/O料金

また、Aurora I/O-Optimizedでは時間あたりのインスタンス料金についても、以下の表のようにAurora Standardのインスタンス料金と比較して約1.3倍となります。

汎用スペックのインスタンス料金

インスタンス料金は、RIも含めて1.3倍となる点に注意してください。そのため、RIをすでに購入済みの場合でRIを追加購入しない場合は、その差額が請求される形となります。RIを追加購入した方がお得な場合は、購入数を30%増やしましょう。

例えば、db.t3.mediumのRIを2台購入している場合は、実際にかかるインスタンス料金は 2 * 1.3 = 2.6台分 で、RIは1台からしか購入できないため、追加購入はしない方が良いということになります。一方で、db.t3.mediumのRIを4台購入している場合は、実際にかかるインスタンス料金は 4 * 1.3 = 5.2台分 で、RIを1台追加購入した方が良いということになります。

まとめると、Aurora I/O-Optimizedは以下のようなコスト体系となります。

下記の2点と引き換えに、I/O費用が実質無料*1になる
- ストレージ費用（Aurora:StorageUsage）が約2.25倍に増加する
- インスタンスのランニング費用がRI含めて約30％増加する

移行をする際には、概算した移行後のコストと現状のコストとを比較して、どれくらいのコスト効果があるかを見るようにしましよう。

Cost ExplorerでI/O費用（コンソール上の表記はAurora:StorageIOUsage）が極端に高くなっているDBインスタンスを調べ、それらの現状のコストをスプレッドシートにまとめ、それらから移行後のコストを概算し、どれくらい安くなるかを調査すると良いでしょう。

切り替え方法

切り替えの方法は非常に簡単です。

マネジメントコンソールにて、移行対象のクラスターを選択し、「変更」を選択します。

その後、設定の編集画面に遷移し、スクロールしていくと以下のような「クラスターストレージ設定」という項目の「Aurora I/O 最適化」で設定変更が可能です。設定変更によるダウンタイムは発生しません。

コンソールからの切り替え

移行の際の注意点

ここからは、移行の際に注意していただきたいポイントをいくつか取り上げたいと思います。

本番環境でそこまで安くならない場合がある

弊社のDBクラスター環境において、開発環境と検証環境においては大幅なコスト効果があるものの、本番環境では移行しても安くならないというケースがありました。これは、本番環境のインスタンスタイプで db.r5.large を使用しており、バッファキャッシュのヒット率を高く保てていたため、I/O処理の発生を抑制することができ、結果的にI/Oリクエストによる課金を抑えられていました。

このバッファキャッシュのヒット率とは、I/O処理を増やす要因のひとつであり、これが低いとI/O処理のリクエスト数が多くなります。 CloudWatchメトリクスでは Buffer Cache Hit Ratio で確認できます。

このバッファキャッシュのヒット率は shared_buffers に割り当てられているメモリ量に依存しており、そのメモリ量はインスタンスサイズに依存しています。そのため、インスタンスサイズが小さい開発環境/検証環境ではI/Oリクエストが多いが、インスタンスサイズが大きい本番環境ではI/Oリクエストを抑えられているという状況が発生する可能性があります。

詳細につきましては、以下のドキュメントが非常に参考になりました。

aws.amazon.com

移行に際してのコスト調査を行う際は、上記に注意して本番環境で思ったより安くならない可能性がある、ということを頭に入れておくと良いと思います。

移行に関して幾つかの制約事項がある

移行の際にダウンタイムは発生しないものの、以下の制約事項がある点に注意してください。

ストレージオプションは、1ヶ月に1回しか変更できない
Aurora MySQL バージョン 3.03.1 以降、Aurora PostgreSQL v15.2 以降、v14.7 以降、v13.10 以降の最新バージョンでのみ設定可能

おわりに

Aurora I/O-OptimizedでRDSのコストを削減した事例についてご紹介いたしました。この記事が皆さんのお役に立てていただければ幸いです。

明日の記事は、moritaさんの「Headful な Selenium を Lambda で動かしたい」になります！

お楽しみに！

*1:厳密には無料ではなく、利用料金に含まれる形になる

EM（エンジニアリングマネージャ）になって１年半経った振り返り

2024-12-11T12:00:00+09:00

はじめに
エンジニアリングマネージャーへの転換
フィードバックの価値
読書の価値
まとめ

はじめに

新規事業部の UT です。

これは Gunosy AdventCalendar 2024 の11日目の記事です。

以前はリードエンジニアとして従事していましたが、約1年半前にエンジニアリングマネージャーへと役割を変えました。

この記事が、キャリアについて悩んでいる方々の参考になれば幸いです。

記事には関係ないうちの猫

エンジニアリングマネージャーへの転換

まずエンジニアリングマネージャーへの役割転換は、上司からキャリアの中での経験としてプラスなのでやってみないか？というアドバイスを受け、引き受けることにしました。キャリアスタートからマネージャーになりたいという人は自分の観測範囲ではあまり多くなく、大体はこのように推薦されてなる方が多いのではないでしょうか？私も例にもれず、同様の経緯でマネージャーになりました。

技術から離れてしまって自分の得意領域から遠ざかってしまい、価値が出せなくなるのではという心配も少なからずあり、この選択は一時的には不安でもありました。

この職種の転換は、自分としてもチームの技術的な課題を解決することから、人々の成長とチームの成功を支援する立場への大きな変化だったはずでしたが、同じチーム内でスタートしたことと、元々リードエンジニアのときもチームの成長という責務を持っていたため、実際エンジニアリングマネージャーになったあともあまり大きく意識せず進めていました。

リードエンジニアとして意識して実行していたことは、技術的な意思決定の主導だったり、技術的な問題解決の中心的役割、チームメンバーへの技術的なメンタリングなど技術にフォーカスした動きでした。

リードエンジニアの延長でのマネジメントをしていると、基本的には技術的に困っていること、技術的な話に終始しがちです。

マネージャー職でありがちな、チーム全体の方向性とそれぞれのメンバーをどのように支援していくかを優先するべきところを、自分自身の進捗を感じられず実装タスクを取ってしまう罠です。

またエンジニアリングマネージャーになってから半年ほどで、新規開発チームへの移動もあり領域を大きく変えました。と同時に今まではドメイン領域に詳しかったため簡単にできていたチームのタスク相談が、新規に移動することで今までのドメイン知識がほぼ使えなくなり、急に自分への価値に悩むことが増えました。

フィードバックの価値

そんな中、会社として社外の方にマネジメントのコーチングとして1on1をつけてもらえることになりました。

新卒のときは、色々フィードバックを上司にもらっていましたが、マネージャーになるとそもそもフィードバックをもらえるタイミングが激減します。コーチングの1on1の際に、フィードバックを受け、ときには厳しい言葉をいただくと改めてフィードバックの重要性を感じました。このような機会を提供してくれている会社には感謝しています。

もちろん、フィードバックがなくても自己啓発や自主学習を通じて継続的に成長できる方もいるでしょう。しかし私自身は、外部からの客観的な視点やアドバイスなしでは、自分の課題や改善点を適切に把握し、効果的な成長を遂げることは非常に困難でした。特に新規事業での新しい役割や環境に適応しようとする際には、経験者からのフィードバックは良い学びの機会となりました。このことから考えると、私たちもメンバーに対して積極的にフィードバックを行うことが重要だということがわかります。さらに、メンバーの成長を促すだけでなく、私たち自身も相手の意見を聞き、新たな視点を得ることで、組織全体のレベルアップに貢献することができます。

また1on1の中でマネジメントは経験から学ぶのではなく先人たちに学ぶとよいとアドバイスを受けました。確かに、実際の経験は必要ではあるものの、マネジメントは歴史が長く、その歴史で蓄積された成功事例や失敗事例から学ぶことは、より効率的な成長につながると考えます。なぜなら、マネジメントはテクノロジーと異なり、人間関係を基盤とするため、経験だけで対応するのは非常にリスクが高いからです。特にメンバーへのフィードバックは、マネジメントの中でも重要な要素であり、フィードバック方法を間違えるとメンバーの成長を阻害することになりかねません。最悪の場合、メンバーとの信頼関係を損ない、チーム全体のパフォーマンスに悪影響を及ぼすこともあります。

メンバー一人ひとりが、より良いマネジメントを受けたいと願っているはずなので、過去の成功事例や先人たちの知恵を積極的に学び、実践していくことが重要です。

読書の価値

歴史から学ぶとは、結論書籍から学ぶということです。

最後に本記事では、私が読んできた書籍の中で、特に影響を受けたものを紹介します。

１. 急成長を導くマネージャーの型

急成長を導くマネージャーの型　～地位・権力が通用しない時代の“イーブン”なマネジメント

作者:長村禎庸
技術評論社

Amazon

ベンチャーなどの急成長している企業でのマネジメントとはどう進めればよいのかを、実際にベンチャーでマネジメントをした著者が解説している書籍です。

ベンチャーにおけるマネージャーは経営陣が何を求めているかを理解し、経営陣が求めている成果を出すという言葉の通り、単純にお困り相談室ではなく、経営目線に合わせたチームマネジメントが求められるということです。

今私が従事している新規事業においては、マネージャーは役割にこだわっている場合ではなく、いかに成果に最短で向き合えるかが重要なので、上記の言葉は重く受け止めました。

また、本書ではベンチャーで行うマネジメントはプレイングマネージャーであるという前提で語られています。プレイングマネージャーは一般的にアンチパターンとされていますが、私自身はプレイングマネージャーとして活動しています。著者の状況が自分の経験と重なっていたため、より深く内容を理解することができました。

一方成果にこだわるという視点は共通しつつも、特に印象的だったのは、メンバー一人一人の本質的な成長と成功へのコミットメントが、マネージャーとしての持続的な成果につながるという指摘でした。これは私がリードエンジニアのときから意識していたことではありましたが、一人で成せるものの大きさはたかが知れているので、チーム全体の能力を引き上げ、チームで達成することを優先することを改めて再認識しました。

新規立ち上げで直面するチームの課題であるなかなか成果が出ない時期をどう乗り越えるかについて、まさに悩んでいた時期でもあったので、「モメンタム」を作ることの重要性を感じ、プロダクトへのフィードバックをどう増やすかに注力するよう変化しました。

２. キャリアづくりの教科書

キャリアづくりの教科書 (NewsPicksパブリッシング)

作者:徳谷智史
ニューズピックス

Amazon

本書は学生から経営陣まで、それぞれのキャリアステージに応じたキャリアデザインの方法について解説しています。

この本を読むことでまず自身のキャリアに関して注意が向き、漫然と仕事をしていないか？市場価値をしっかり高められているか？という危機感を改めて認識させられました。

マネージャー職のキャリアに関しても丸１章言及されており、そこでの一番シビレた言葉がキャリア形成を支援できないマネージャーは評価されないという言葉で、やはりまだプレイヤーとしての意識が強く残っていた自分には大きく殴られたような感覚を持ちました。

そこから改めて自分はメンバーのキャリア支援ができているのかと（やっと）自問し始めました。自身はプレイングマネージャーとして働いているため、どちらかというとプレイングの方に比重を置きがちでしたが、改めてマネージャーとして役割を引き受けているのであれば、キャリア支援しなければ価値はないと気付かされた一冊です。

キャリアづくりというタイトルから自身のキャリアを作る話だけかと思われる方も多いと思いますが、メンバーのキャリア支援をどうするか、各個人を成長させる組織をどのように作っていけばよいか、というところまで踏み込んでいます。

メンバーの退職という出来事も重なり、マネージャーとしての役割を深く考えるきっかけとなりました。同じような課題に直面している方には、ぜひ一読をお勧めします。

まとめ

この１年半でマネジメントに対する意識の変化について紹介しましたが、実際行動というところでいうとまだまだ足りていないところだらけです。

果たして今どこまで自分がチームを最大化するためのマネジメントができているかはわからないですが、少なくとも一緒に働いて成長できた、キャリアとして良い時間を過ごせたと思ってもらえた上でチームとしての成果も出せるようなマネジメントができるように頑張っていきたい所存です。

Lexical で文章の修正提案機能を自作しよう！

2024-12-10T12:00:00+09:00

はじめに

こんにちは。Gunosy新規事業開発室の上村 id:muemura です。

本記事は、Gunosy Advent Calendar 2024 10日目の記事です。昨日の記事は、小野 id:takuto_ono さんの「3年目iOSエンジニアがGunosyに転職して思ったこと」でした。

tech.gunosy.io

今回は、新規事業開発室で行っているエディタ開発において、文章の修正提案機能を自作した話を紹介します。

はじめに
エディタ開発
- 単語の修正提案機能
どんなもの？
Lexical の拡張機能について簡単に紹介
終わりに

エディタ開発

現在、新規事業開発室ではWebサイト上での文章作成を支援するエディタの開発を行っています。エディタの開発では、Meta社が開発したオープンソースのテキストエディタフレームワークであるLexicalを使用しています。

lexical.dev

Lexicalは、軽量で高速なパフォーマンスを持ち、プラグインを通じて機能を拡張できる柔軟性が特徴です。公式でプレイグランドを公開しているため、簡単に試すことができます。

現在開発している環境では、TypeScript + React を使用しているため、本記事ではこの環境を前提として進めます。

単語の修正提案機能

どんなもの？

エディタ上で文章を編集する際、特定の単語を自動で検知して修正を提案する機能です。具体的には、あらかじめ登録された単語辞書等を基に、文章中の特定の単語に対して修正案を表示し、ユーザーが必要に応じて修正を適用できます。この文章校正機能により、より正確で一貫性のある文章作成をサポートします。

修正提案機能

Lexical の拡張機能について簡単に紹介

Lexical は、拡張機能を追加することで様々な機能を追加できます。詳しくは公式ドキュメントを参照してください。

ざっくりとした流れ（一例）は以下の通りです。

独自のLexicalNodeを作成
- TextNode や ElementNode などのノードを継承して、持たせたいデータを持つノードを定義します。
定義したNodeに変換、または新規追加するプラグインを作成
- 正規表現などを用いて特定の文字列を検出し、独自定義したNodeに変換するプラグインを作成します。
プラグインとNodeを登録
- 独自で追加したNodeとプラグインをエディタに登録して扱えるようにします。

修正内容を保持する LexicalNode の作成

修正内容を保持するノードを作成します。今回は、ノードを SuggestionNode として定義します。

import type { EditorConfig, LexicalNode, TextNode } from "lexical";

export class SuggestionNode extends TextNode {
  /** @internal */
  __suggestText?: string;

  static getType(): string {
    return "suggestion";
  }

  createDOM(config: EditorConfig): HTMLElement {
    const dom = super.createDOM(config);
    dom.style.cursor = "default";
    dom.className = "suggestion";
    return dom;
  }

  getSuggestText(): string {
    return this.getLatest().__suggestText ?? "";
  }

  setSuggestText(suggestText: string): this {
    const self = this.getWritable();
    self.__suggestText = suggestText;
    return self;
  }

  /* その他 serialize, clone まわりの定義も必要 */
  ...
}

export function $createSuggestionNode(
  text: string,
  suggestText: string
): SuggestionNode {
  return new SuggestionNode(text, suggestText);
}

export function $isSuggestionNode(
  node: LexicalNode | null | undefined
): boolean {
  return node instanceof SuggestionNode;
}

SuggestionNode は、修正内容のテキストを保持するための __suggestText プロパティを持たせています。また、createDOM メソッドをオーバーライドして、修正提案のノードを表示する際のスタイルを設定しています。

プラグインの作成

次に、修正提案機能を実装するプラグインを作成します。今回は以下の2つのプラグインを作成します。

既存のテキストから特定の単語を検出して SuggestionNode に変換するプラグイン
SuggestionNode を hover した際に修正提案を表示するプラグイン

これらを順に実装していきます。

1. 既存のテキストから特定の単語を検出して SuggestionNode に変換するプラグイン

単純な正規表現で変換を行う場合は、useLexicalTextEntity *1 を使用することで簡単に実装できます。

込み入った変換を行う場合は、TextNode から変換する処理 ($textNodeTransform) と TextNode に戻す変換をする処理 ($reverseNodeTransform) を自前で定義して registerNodeTransform で処理を登録しましょう。
今回は簡単に実装するため、useLexicalTextEntity を使用する例を紹介します。

import { useLexicalComposerContext } from "@lexical/react/LexicalComposerContext";
import { useLexicalTextEntity } from '@lexical/react/useLexicalTextEntity';
import { useCallback, useEffect } from "react";

const SUGGESTION_WORDS_MAP: Map<string, string> = ([
    // 修正を提案したい単語と修正後の単語のマッピング
    // 例: ["修正を提案したい単語1", "修正後の単語1"]
    ["修正を提案したい単語1","修正後の単語1"],
    ["修正を提案したい単語2","修正後の単語2"],
]);
const SUGGESTION_REGEX = new RegExp(
  Array.from(SUGGESTION_WORDS_MAP.keys()).join("|"),
  "g"
);

export default function SuggestionPlugin(): JSX.Element | null {
  const [editor] = useLexicalComposerContext();

  // エディタにSuggestionNodeが登録されているか確認
  useEffect(() => {
    if (!editor.hasNodes([SuggestionNode])) {
      throw new Error(
        "SuggestionPlugin: SuggestionNode not registered on editor"
      );
    }
  }, [editor]);

  // TextNode から SuggestionNode に変換する処理
  const $createSuggestionNode_ = useCallback(
    (textNode: TextNode): SuggestionNode => {
      // 登録された単語を検出し、対応する修正案に置換
      const targetText = textNode.getTextContent();
      const suggestText = targetText.replace(SUGGESTION_REGEX, (match) =>
        SUGGESTION_WORDS_MAP[match]
      );
      // 新しい SuggestionNode を作成して返す
      return $createSuggestionNode(text, suggestText);
    },
    []
  );

  // Matcher (どこからどこまでを SuggestionNode に変換するか)の定義
  const getSuggestionMatch = useCallback((text: string) => {
    const matchArr = SUGGESTION_REGEX.exec(text);
    if (matchArr === null) {
      return null;
    }

    return {
      end: matchArr.index + matchArr[0].length,
      start: matchArr.index,
    };
  }, []);

  // プラグインの登録
  useLexicalTextEntity<SuggestionNode>(
    getSuggestionMatch,
    SuggestionNode,
    $createSuggestionNode_,
  );

  return null;
}

SUGGESTION_WORDS_MAP に登録された単語を検出して、それぞれの修正後の単語を保持する SuggestionNode に変換するプラグインとして SuggestionsPlugin を定義しています。 useLexicalTextEntity は、マッチするテキストを特定のノードに変換することができる便利なフックです。

2. SuggestionNode を hover した際に修正提案を表示するプラグイン

SuggestionNode だけでは修正提案を表示することができません。今回は、エディタ上で SuggestionNode を hover した際に修正提案を表示し、修正するためのプラグインを作成します。

import { useLexicalComposerContext } from "@lexical/react/LexicalComposerContext";
import {
  $getNearestNodeFromDOMNode,
  $getNodeByKey,
  LexicalNode,
  NodeKey,
} from "lexical";
import {useState, useEffect, useCallback, useRef} from "react";
import { createPortal } from "react-dom";
import { mergeRegister } from "@lexical/utils";
// https://github.com/facebook/lexical/blob/05fa244bd0f6043114ffb8feab2922d8e4de7e6f/packages/lexical-playground/src/plugins/CodeActionMenuPlugin/utils.ts
import {useDebounce} from "./utils";
import IconClose from "@/components/svg/IconClose";

function SuggestionQuickFixContainer({anchorElem}: {anchorElem: HTMLElement | null}): JSX.Element {
  const [editor] = useLexicalComposerContext();
  // 修正提案のテキスト
  const [suggestionText, setSuggestText] = useState<string>("");
  // 修正対象のSuggestionNodeのキー
  const [suggestionNodeKey, setSuggestionNodeKey] = useState<NodeKey | null>(
    null
  );
  // 修正提案のダイアログを表示するかどうか
  const [isShown, setIsShown] = useState<boolean>(false);
  // マウスの動きを監視するかどうか
  const [shouldListenMouseMove, setShouldListenMouseMove] =
    useState<boolean>(false);
  // ダイアログの表示位置
  const [position, setPosition] = useState({});
  // 現在エディタ上に存在するSuggestionNodeのキーを保持するSet
  const codeSetRef = useRef<Set<NodeKey>>(new Set());
  // 現在ホバーしているSuggestionNodeのDOM要素への参照
  const sugestionDOMNodeRef = useRef<HTMLElement | null>(null);

  // マウスの移動を監視するため、debounce して処理を行う
  const debouncedOnMouseMove = useDebounce(
    (event: MouseEvent) => {
      // マウスの位置情報を取得して、SuggestionNode に hover しているか判定
      const { isOutside, sugestionDOMNode } = getMouseInfo(event);
      if (isOutside) {
        setIsShown(false);
        return;
      }

      if (!sugestionDOMNode) {
        return;
      }

      sugestionDOMNodeRef.current = sugestionDOMNode;

      let hoveredNode: LexicalNode | null = null;
      let sugestionDOMElement: HTMLElement | null = null;

      editor.update(() => {
        // DOM から取得した Node が SuggestionNode かどうか判定
        const maybeSuggestionNode =
          $getNearestNodeFromDOMNode(sugestionDOMNode);

        // SuggestionNode であれば、NodeKey を元に修正提案のテキストを取得
        if (maybeSuggestionNode && $isSuggestionNode(maybeSuggestionNode)) {
          sugestionDOMElement = editor.getElementByKey(
            maybeSuggestionNode?.getKey()
          );
          setSuggestionNodeKey(maybeSuggestionNode.getKey());
          setSuggestText(
            (maybeSuggestionNode as SuggestionNode).getSuggestText()
          );

          if (sugestionDOMElement) {
            hoveredNode = maybeSuggestionNode;
          }
        }
      });

      // 修正提案のダイアログを表示する位置を設定 (SuggestionNode の右下あたりに表示されるように調整)
      if (sugestionDOMElement) {
        const {
          height: suggestionElemHeight,
          top: suggestionElemTop,
          right: suggestionElemRight,
        } = (sugestionDOMElement as HTMLSpanElement).getBoundingClientRect();
        const { y: editorElemY } = anchorElem.getBoundingClientRect();

        if (hoveredNode) {
          setIsShown(true);
          setPosition({
            left: suggestionElemRight,
            top: suggestionElemTop + suggestionElemHeight - editorElemY,
          });
        }
      }
    },
    50,
    250
  );

  // mousemove にイベントリスナーを登録
  useEffect(() => {
    if (!shouldListenMouseMove) {
      return;
    }
    document.addEventListener("mousemove", debouncedOnMouseMove);

    return () => {
      setIsShown(false);
      debouncedOnMouseMove.cancel();
      document.removeEventListener("mousemove", debouncedOnMouseMove);
    };
  }, [shouldListenMouseMove, debouncedOnMouseMove]);

  // SuggestionNode の変更を監視
  useEffect(() => {
    return mergeRegister(
      editor.registerMutationListener(SuggestionNode, (mutations) => {
        editor.getEditorState().read(() => {
          for (const [key, type] of mutations) {
            switch (type) {
              case "created":
                codeSetRef.current.add(key);
                setShouldListenMouseMove(codeSetRef.current.size > 0);
                break;
              case "updated":
                if (!codeSetRef.current.has(key)) {
                  codeSetRef.current.add(key);
                }
                setShouldListenMouseMove(codeSetRef.current.size > 0);
                break;
              case "destroyed":
                codeSetRef.current.delete(key);
                setShouldListenMouseMove(codeSetRef.current.size > 0);
                break;

              default:
                break;
            }
          }
        });
      })
    );
  }, [editor]);

  // 修正提案を適用する処理
  // setTextContent で内容が変更されると、上記で定義した正規表現に引っ掛からなくなるため、自動的に TextNode に変換される
  const quickFixHandler = useCallback(() => {
    editor.update(() => {
      if (suggestionNodeKey) {
        const maybeSuggestionNode = $getNodeByKey(suggestionNodeKey);
        if (maybeSuggestionNode && $isSuggestionNode(maybeSuggestionNode)) {
          (maybeSuggestionNode as SuggestionNode).setTextContent(
            suggestionText
          );
        }
      }
    });

    setIsShown(false);
  }, [editor, suggestionText, suggestionNodeKey]);

  return (
    <>
      {isShown && (
        <div
          className="suggestionQuickFix"
          style={{ ...position }}
        >
          <button
            className="suggestionQuickFixButton"
            onClick={quickFixHandler}
          >
            {suggestionText}
          </button>
          <button
            className="suggestionQuickFixCloseButton"
            onClick={setIsShown(false)}
          >
            <IconClose />
          </button>
        </div>
      )}
    </>
  );
}

function getMouseInfo(event: MouseEvent): {
  sugestionDOMNode: HTMLElement | null;
  isOutside: boolean;
} {
  const target = event.target;
  if (
    target &&
    (target instanceof HTMLElement || target instanceof SVGElement)
  ) {
    // suggestionNode は span.suggestion で定義されているため、それを元に判定
    const sugestionDOMNode = target.closest<HTMLElement>("span.suggestion");
    // 修正提案のダイアログ外をクリックしたかどうかの判定
    const isOutside = !(
      sugestionDOMNode || target.closest<HTMLElement>("div.suggestionQuickFix")
    );

    return { isOutside, sugestionDOMNode };
  } else {
    return { isOutside: true, sugestionDOMNode: null };
  }
}

export default function SuggestionQuickFixPlugin({
  isReadOnly = false,
  anchorElem = document.body,
}: {
  isReadOnly?: boolean;
  anchorElem?: HTMLElement;
}): React.ReactPortal | null {
  if (isReadOnly) {
    return null;
  }

  return createPortal(
    <SuggestionQuickFixContainer anchorElem={anchorElem} />,
    anchorElem
  );
}

SuggestionQuickFixContainer は、SuggestionNode を hover した際に修正提案を表示するためのコンポーネントを定義しています。具体的には、マウスの位置から Node を特定し、それが SuggestionNode だった場合に修正提案を表示を行い、提案を適用するための処理を仕込むような形で実装しています。

プラグインの登録

最後に、作成したプラグインをエディタに登録します。詳細は、公式ドキュメントのページを参照してください。

// config に作成した Node を登録
const initialConfig = {
  namespace: 'MyEditor',
  nodes: [SuggestionNode],
};

// Pluginは、LexicalComposer の子要素として登録
 <LexicalComposer initialConfig={initialConfig}>
    <SuggestionPlugin />
    <SuggestionQuickFixPlugin />
 </LexicalComposer>

実際の挙動

以下のように、エディタ上で特定の単語を検知して、修正提案を表示し、修正を適用することができるようになりました。

修正提案機能の挙動

今回は簡単に実装するため、正規表現で単語を検出して修正提案を表示するような形で実装しましたが、LLMを使用してより高度な修正提案機能を実装したり、文章の続きを生成するような執筆のサポートを行ったりすることもできるので、興味があれば試してみてください。

終わりに

Lexical を使用して文章の修正提案機能を自作する方法を紹介しました。

実際 Lexical の開発をしてみると、まだ Lexical 自体のバグに当たることが多く、ある程度ソースコードを見ながら開発する必要があるため、最初はとっつきにくく感じることもあるかもしれません。しかし、柔軟な拡張を行うことができる Lexical を使いこなすことで、様々な機能を追加することができるため、触ってみる価値はあると思います！今回の記事で、Lexical を使った自由なエディタ開発に興味を持っていただければ幸いです。

明日は、 UT id:yuutookun さんの「EM（エンジニアリングマネージャ）を１年半やって」です。お楽しみに！

*1:https://lexical.dev/docs/api/modules/lexical_react_useLexicalTextEntity

3 年目 iOS エンジニアが Gunosy に転職して思ったこと

2024-12-09T12:00:00+09:00

はじめに

こんにちは。 iOS アプリを開発している小野です。

この記事は Gunosy Advent Calendar 2024 の 9 日目の記事です。 8 日目の記事は skozawa さんのデータ基盤のコストを Amazon S3 Intelligent-Tiering で削減するでした。

私は 2024 年 10 月に Gunosy に入社しました。今回は 2024 年アドベントカレンダーの機会に、入社からこの 1 ~ 2 ヶ月を振り返っていきます。

はじめに
自己紹介
転職の背景
Gunosy の文化
新環境で習得したスキルと知識
入社後のタスク
最後に

自己紹介

埼玉県在住の 25 歳です。 Gunosy は 2 社目で初めての転職となります。

前職は toB 向けのアプリ開発に従事しており、 Swift メインと Objective-C で開発していました。

転職の背景

転職活動の軸として、 1 つのアプリに長く携わりたいと考えていました。具体的には、開発して終わるのではなく、その後も継続的に事業として成長させていきたいという思いがありました。このような思いを抱きながら転職活動を進め、 Gunosy の面接を受けさせていただきました。

面接を通じて、 Gunosy で働くエンジニアの方々と一緒に仕事をすることで、自分の成長につながると感じ、 Gunosy への転職を決意しました。

( Gunosy を初めて知ったのは私が高校生の頃です。当時スマホが普及し始めており、私もスマホを持ち始めた頃にニュースアプリとして Gunosy をインストールしていました。 Gunosy の CM を見ていた記憶があります。あの CM 制作に携わっていたと話す社員の方がいたのでちょっと驚きました。)

Gunosy の文化

入社から振り返って、 Gunosy に入社していいなと感じた文化を挙げていきます。

① 毎日のコードレビュー

iOS チームではその日に書いたコードはその日のうちにコードレビューを実施しています。 PR を提出して各自確認する時間を取ろうとすると PR が溜まっていく危惧があるため、 MTG の時間を設けて実施しています。

これに感じるメリットとして、リモートが多い環境下で毎日決まった時間に MTG があるので、質問しやすいという点があります。もちろん Slack 等でも質問はできますが、通話を繋ぐことでより具体的に伝えられ、早く課題を解決することができます。また、コードレビュー時にコードの意図を説明する必要があるため、復習にもなりエンジニアとしての学習にも繋がると実感してます。

② 数値確認

毎朝の MTG で、各アプリの数値確認を行っています。

売上や DAU （日間アクティブユーザー数）等を確認したり、クラッシュ率やインプレッション数を見てアプリに異常がないかを確認します。また、新しい施策が利用者に効果的だったかを諸々確認しています。特にニュースアプリということで、どの記事が利用者に読まれたのかも見ることができ、世間の関心のあることが何かがわかるのも興味深いです。

アプリ内でログ収集をしているので、どの経路でユーザーが流入したのかも確認することができたり、画面の表示やクリック率等も確認することができます。自分の開発した機能がどのくらいのユーザーに利用されているかも確認でき、開発した機能の良し悪しも判断できるので、開発者としては非常に役立ちます。

③ 技術ブログ

Gunosy ではテックブログやデータ分析ブログで技術記事を書く文化があります。業務の中で得た知識をブログに書くことで、自分の中で整理することができます。同時にオープンに情報を共有することで、社内で何をしているのかを Gunosy に興味を持ってくれている方に届けられます。私も転職活動の際に企業調査の一環として、確認させてもらっていました。

入社後も拝見することが度々あり、特に auサービスToday 開発初期の設計思想が記載された記事は、アプリの設計を理解するのに役立ちました。

2021年にSwiftUIを部分利用しつつ新規のiOSアプリを作った - Gunosy Tech Blog

新環境で習得したスキルと知識

① Swift Concurrency

私が現在従事している開発は「 auサービスToday 」の iOS アプリです。 auサービスToday は MVVM + Clean Architecture を採用しており、その中で Swift Concurrency や Combine を使用しています。

この技術の習得には苦戦しました。前職では非同期処理に DispatchQueue や Closure を多用していたため、 Swift Concurrency に馴染みが薄かったのです。

理解を深めるために活用できたのが、 Swift Concurrency のチートシートです。
Swift Concurrency チートシート

この資料はチームメンバーが Swift Concurrency を導入した当初の輪読会で活用していたものと聞いております。これさえ読んで理解すれば大体のことを掴めました。特に馴染みのなかったactorについて詳細に学べたのは良かったです。 actorを使用することで、同時にアクセスできる Task が一つに限定され、データ競合が発生せず整合性が保たれることが保証されます。また、actorのプロパティは外部から直接更新できないため、不適切なアクセスや変更を防ぐことができ、開発者として安心感があります。

本アプリでなぜこの技術を使用しているかをチームメンバーに聞きながら理解を深めていくことで、追加実装の際にも本質を理解しながら開発を進められています。

② Combine

Combine も同様に苦戦しました。リアクティブプログラミング自体を使った経験がなかったためです。特に注意が必要だったのがUITableViewCellを使用した際の処理です。コーディングの書き方によりますが、tableView (_:cellForRowAt:)で Combine の Publisher を購読した場合 UITableViewCellは再利用されるためインスタンス破棄による購読解除ができず、prepareForReuseメソッドでSet<AnyCancellable>()を初期化する必要があります。 (awakeFromNibで監視処理をセットした場合は、再利用時にメソッドが呼ばれないため、初期化は不要となります。) 初期化をしないことで、再利用前のサブスクリプションが残ったままとなり、多重購読が発生し、同じイベントに対して複数回の処理が実行される危険性がありました。

リアクティブプログラミングを使用することでどのようなメリットがあるのか、入社当初は理解が不足しておりましたが、実際に開発を進めるうちに私なりのメリットを感じるようになりました。

疎結合
Combine を使用することで、ViewModelがViewControllerを直接保持することなく処理を行うことができ、疎結合な設計が可能になります。
宣言的な記述と再利用性の向上
データの変化に対する反応を宣言的に記述できるため、コードの再利用性が高まります。
統一されたコーディングスタイル
設計が統一されているため、後からプロジェクトに参加した開発者でも実装に入りやすいというメリットがあります。

リアクティブプログラミングに不慣れだった私でも、コーディングの統一性によりスムーズに実装を進めることができました。一箇所を理解すれば、他の箇所も同様の処理であることが多いため、わかりやすいです。

一度取得してしまえば、これほど便利なものはありません。より便利なものを取り入れようとするチームメンバーの姿勢を見習っていきたいです。

③ SwiftUI の活用

auサービスToday は SwiftUI と UIKit のハイブリッドアプリ開発を行っています。

前職では UIKit と Objective-C での開発経験しかなかったため、 SwiftUI のようなモダンな環境は非常に新鮮でした。 SwiftUI を触ったことはありましたが、実務での経験はありませんでした。 UIKit と SwiftUI のハイブリッド開発では、UIHostingControllerを使用することで、 UIKit のライフサイクルや画面遷移を活用しつつ、 UIKit の画面の子要素として SwiftUI で UI を実装しています。

依然として UIKit には高度なカスタマイズや細かい制御が可能なコンポーネントが存在します。 SwiftUI はコードベースで UI を実装できるため、コードレビューや UI の変更が容易になります。両方の良いところを取り入れることで、開発者として非常に満足しています。

また、 SwiftUI と Combine は相性が良く、@ObservedObjectを使用して監視対象オブジェクトの変更を検知し、 View を更新することが可能になることから、 ViewModel 側でプロパティの保持が実現できています。 SwiftUI が監視対象の更新ごとに再描画を行う仕組みを理解することで、より深い理解が得られました。

④ A/B テスト

toC 向けアプリでは、利用者のフィードバックを直接受け取るのが難しいため、 A/B テストやログ収集をアプリ内に組み込むことで機能の改善やユーザーのニーズを把握しています。このログ収集は先述の数値確認にも繋がっています。 A/B テストでは、新機能を特定のユーザー数 % にのみ適用し、反映前と比較します。その結果を分析し、新機能が良い数値をもたらせば全てのユーザーに反映させ、逆に数値が下がったり売上が減少する場合は新機能を撤退させるフローになっています。このプロセスを通じてユーザーのニーズや行動が明確になり、新しい施策の考案にも繋がっているようです。より多くのユーザーにアプリを利用してもらえるような施策を考える上で、 A/B テストは非常に重要な役割を果たしていると感じました。

実装に関しても A/B テスト処理の組み込みは容易なものでしたので、どのアプリに導入しても良さそうな手法だと思います。

入社後のタスク

初めのオンボーディング期間では簡単な機能の追加を担当しました。その際、アーキテクチャや設計思想を理解するために、余裕を持った時間を設けていただきました。

環境にも慣れ始めた頃、施策の一つとして記事リストに新しい形式のコンテンツを追加する実装を行いました。記事リストは本アプリの根幹部分であり、内部処理の複雑性が増しています。それでも、メンテナンス性の高い設計が施されていたため、新しいコンテンツ追加時の影響範囲は小さく、開発をスムーズに進めることができました。

実装期間でサーバーサイドとの API 通信の動作確認時に、設計時に考案した通りに動作しない事態が発生し、新規 API の実装が必要となりました。サーバーサイドとの認識に齟齬があったことが原因でした。原因の調査に際しては、多くのメンバーを巻き込んで迅速に問題を発見することができ、その後のサーバー側の新規 API の実装も早く、結果としてクライアント側のスケジュールを遅らせることなく進めることができました。

これは Gunosy のエンジニア皆様が高い能力を持ち、一人一人が当事者意識を持つ環境であること。これにより素早い開発体制、リリース頻度を高く維持できていると感じました。

最後に

Gunosy には技術に関心が高い方が多く、非常に学びの多い環境です。また、エンジニアとして技術面だけでなく、施策の考案や施策の分析も行います。ビジネス志向の視点も身につけることができ、自分の領域を広げる機会も多いと感じました。実際にエンジニアからビジネス寄りのポジションに移られた方もいらっしゃいます。こうした環境下で、私自身もとても楽しく働くことができています。全員でより良いものを作り上げていこうという姿勢が全面にあり、その雰囲気にも惹かれています。

私もより一層、精進していきたいと思います。

明日は uemura さんが Lexical で文章の修正提案機能を自作するについてお話します。お楽しみに！

データ基盤のコストをAmazon S3 Intelligent-Tieringで削減する

2024-12-08T11:02:41+09:00

こんにちは。id:skozawa です。

こちらの記事は Gunosy Advent Calendar 2024 の 8 日目の記事です。昨日は takuji さんの LLM を使った広告問い合わせ対応の話でした。

この記事では Gunosy で運用しているデータ基盤のコスト最適化の話を紹介したいと思います。

背景
データ基盤に求められる要件
AWS Intelligent-Tiering
ライフサイクル設定
検証結果
まとめ

背景

Gunosy ではデータ基盤として AWS の Athena と S3 を主に利用しています。データ基盤の詳細は以下の資料をご覧ください。

Gunosyにおけるデータの民主化を促進するデータ基盤 - Speaker Deck

S3 にはユーザーの行動ログや記事、広告データなどが日々蓄積されていきます。そうすると S3 のコストもどんどん増加していってしまいますが、運用上はコストはできるだけ最小限に抑えたいです。 S3 のコストを最小限にするにはストレージクラスを Glacier Deep Archive クラスにするというアプローチがあり、Gunosy でも以前実践しています。今回はこちらの方法ではなく、データ基盤の要件に合ったアプローチを取ります。

tech.gunosy.io

データ基盤に求められる要件

データ基盤としては、いつでも誰でも欲しいデータにアクセスできる状態をできるだけ担保したいです。そうなるとデータ取得に数時間かかる Glacier Deep Archive クラスは今回のケースには適していません。

また、データのアクセス傾向としては以下のような傾向が見られます。

全てのデータが頻繁にアクセスされるわけではない
新しいデータほど頻繁にアクセスされやすい
どのデータがいつ求められるかは完全には予測できない
- ただし、ある程度の傾向は予測できる

上記の傾向を考慮して、今回はアクセス頻度に応じて自動的にデータのコストが変わる Intelligent-Tiering ストレージクラスを利用してコストを最適化することにしました。

AWS Intelligent-Tiering

AWS S3 Intelligent-Tiering とは、利用頻度に応じてストレージクラスが変わる仕組みです。

初期は Intelligent-Tiering Frequent Access クラス
30 日間アクセスがなかった場合に Intelligent-Tiering Infrequent Access クラスになる
90 日間アクセスがなかった場合に Intelligent-Tiering Archive Instant Access クラスになる

Intelligent-Tiering Archive Instant Access クラスになるとコストは 1/5 程度になります。

オプトインで 180 日間アクセスがなかった場合に Intelligent-Tiering Deep Archive Access クラスにすることができ、更なるコスト削減も可能となりますが、オブジェクトの復元が必要となり即時アクセスができなくなります。データ基盤の「いつでも誰でも欲しいデータにアクセスできる」という要件が満たせなくなるため、今回のケースでは Intelligent-Tiering Deep Archive Access クラスのオプトインはしていません。

aws.amazon.com

ライフサイクル設定

Intelligent Tiering にする S3 のライフサイクルを設定しました。ただし、Intelligent Tiering ではオブジェクトをモニタリングするコストがかかるため、頻繁にアクセスするデータを Intelligent-Tiering クラスにするとコストが悪化してしまいます。そのため、事前にデータのアクセス頻度をある程度予測したのち、データのパスごとに Intelligent-Tiering にするように設定しました。

resource "aws_s3_bucket_lifecycle_configuration" "sample_intelligent_tiering" {
  bucket = aws_s3_bucket.sample.bucket

  rule {
    id     = "sample1-intelligent-tiering"
    status = "Enabled"

    filter {
      and {
        prefix                   = "sample1/"
        object_size_greater_than = 1024 * 1024
      }
    }

    transition {
      days          = 365
      storage_class = "INTELLIGENT_TIERING"
    }
  }

  rule {
    id     = "sample2-intelligent-tiering"
    status = "Enabled"

    filter {
      and {
        prefix                   = "sample2/"
        object_size_greater_than = 1024 * 1024
      }
    }

    transition {
      days          = 180
      storage_class = "INTELLIGENT_TIERING"
    }
  }
}

検証結果

途中で別のデータ削減施策が入ったことで 9 月にデータ量が下がってはいますが、全体の 7 割程度のデータを Intelligent-Tiering クラスに変更し、そのうちの 80%程度が Intelligent-Tiering Archive Instant Access、13%程度が Intelligent-Tiering Infrequent Access クラスになりました。

ストレージタイプごとの容量

そして、コストとしては半額程度に下げることができました。

S3のコスト

まとめ

データ基盤は事業の運営上、必須なものとなっています。データ基盤には日々データが蓄積されており、その分コストも上がってしまうという課題があります。今回はデータ基盤の S3 コストを Intelligent-Tiering の仕組みを利用して半額程度にすることができました。今後はデータ基盤の適切なコストについても検討していきたいと思います。

明日の Gunosy Advent Calendar 2024 は、最近入社された小野さんの入社エントリです。お楽しみに！

LLMを使った広告問い合わせ対応の話

2024-12-07T12:25:00+09:00

こんにちは。ML チームの takuji です。

こちらの記事は Gunosy Advent Calendar 2024 の 7 日目の記事です。

本記事では、LLM を使った広告問い合わせ対応の話を書きたいと思います。

ツール画面

なぜやるのか

弊社では現在、業務効率化を目指して DX プロジェクトを進めています。各部署の業務課題を特定し、作業時間を出した上で、それぞれの課題を DX 化した際の削減時間を見積もり、インパクトの大きい順に取り組みの優先順位を決定しています。
この優先順位に基づいて選定された課題の一つが、広告問い合わせ対応です。私はこの課題を担当することになり、LLM を活用して問い合わせ対応を支援するツールの構築に取り組んでいます。これにより、担当者がより創造的な業務に時間を使えるようになることを目指しています。

どのぐらい作業削減になりそうか

当初は、一日当たり広告運用担当者（以下、担当者）数名の質問が来ると想定していました。しかし、開発を進める中で関係者へのヒアリングを行った結果、実態が見えてきました。
具体的には、以下のような状況が明らかになりました。
- 簡単な質問（Yes / No で回答できてしまう質問）だとそもそも負担ではないこと
- 既存の広告代理店からは依頼系のやり取りが多く、質問が特にない場合があること
- 新規の広告代理店からは質問が来るが、新たに入る代理店の数自体が少ないこと
この時点で、想定とは乖離していることに気づきましたが、新規の広告代理店には使えそうだったため、作業削減には貢献できると判断しました。

業務にどのように組み込んだのか

新しいツールを導入する際は、段階的なアプローチを取ることにしました。完全自動化は初期段階ではリスクが高いと考え、まずは社内の DX アプリケーションのツールの一つとして実装し、試験的な運用からスタートすることにしました。DX アプリケーションは以前から存在していて、複数の部署が利用しています。
すでに利用実績のある DX アプリケーションに組み込むことで、担当者の準備コスト（VPN 接続の設定など）を最小限に抑えて導入を進めることができました。また、担当者が問題なく使用を開始できるように、今回のツールの利用方法はドキュメントにまとめて共有しました。
実際の業務での利用は以下のような流れで行われます。
- 外部のチャットツールなどを経由して代理店から質問が届く
- 担当者は質問を入力して、回答を生成する
- 表示された回答の内容を精査して、適切な判定ステータスを選択する
- 必要であれば回答を手直して、返信内容として使えるレベルの文章にする
  - 生成された回答が完全に間違っている時は全て書き換えてもらう
- 補足や要望があったら、コメントフォームに入力する
- 完了ボタンを押して、結果を slack に投下する
- 回答をコピーして、代理店に返信する

どのように回答を生成したのか

今回のケースでは、LLM が持っている知識だけでは答えられない質問であったため、RAG を採用しました。RAG とは、LLM の知らない情報を検索によって補完して、回答精度を向上させる技術のことです。
情報ソースは以下の3つを利用し、FAQ と PDF 資料は BM25、Zendesk は提供されている API の検索機能を使いました。
- 問い合わせ対応でよくある質問をまとめたスプレッドシート
- Zendesk の記事
- PDF 資料
  - 前処理の段階で、PDF を検索容易にするため、テキスト化しました
  - 具体的には、PDF 内のテキストを抽出する Python ライブラリと OpenAI の GPT-4V を使いました
  - GPT-4V のテキストの誤認識を防ぐため、抽出したテキストをプロンプトに含めました
アーキテクチャーは 3 つほど検討し、性能的に悪くなく保守コストも低い手法 A を採用しました。評価自体は、代理店質問・弊社回答の事例集を使い、生成した回答の正解/不正解は人手で判定を行いました。
検討した手法の特徴は以下の通りです。こちらの記事を参考にしました。
- 手法 A：3 つの情報ソースに検索をかけて関連文書を N 件ずつ取得し、それを元に回答を生成します。情報ソースの優先度（より詳しい内容が載っている情報ソースの方が重要）でプロンプトに差し込む位置を変えて、回答を安定させました。最もシンプルなため、他手法と比べて挙動の制御がしやすいという利点がありました。
- 手法 B：個別の情報ソースで回答まで一度作り、それを統合して最終回答を生成します。中間地点で回答を生成することで余計な情報を削ぎ落とし、回答精度が上がることを期待しました。
- 手法 C：LLM Agent を使い、必要な情報ソースのみ情報を取得して回答を生成します。質問に無関係な情報ソースは取得しないことで回答精度が上がることを期待しました。
評価の結果、手法 C が最も精度が高く、手法 A は少し劣るもののほぼ差がなく、手法 B が最も精度が低いという結果でした。手法 C は Python ライブラリの langchain を使う関係で、デバッグがやや大変で保守運用コストが高い点から、手法 A を採用することにしました。

評価はどうしたのか

ツールの利用時に得られる判定ステータスを使い、どの程度の精度で回答が生成されているかを評価することにしました。判定ステータスは、「正確、一部正確、不正確、不明」の 4 種類を用意しました。
判定基準は以下のように定めました：
- 正確：回答をそのまま利用できる
- 一部正確：軽微な修正で利用できる
- 不正確：大幅な修正が必要、または誤った情報を含む
- 不明：回答できない、または判断できない
正確・一部正確の回答が多い場合には、ある程度実用性があると判断できると考えました。一方で、不正確や不明の回答が多い場合は、情報ソースの見直しや回答生成の方法を改善する必要があると判断できます。
また、各判定結果に対して担当者からコメントを入力できるようにし、どのような点で回答が適切だったか、あるいは不適切だったかを記録できるようにしました。これにより、定性的な評価も可能になりました。

試験運用の結果はどうだったのか

試験運用期間は 2024/08/21 ~ 2024/09/13 で、最終的な使用実績は、27 件 / 23 日 = 1.17 件/日という結果でした。
精度面では、正確・一部正確の回答が 70% でしたが、これは実用化に向けてはまだ改善の余地が大きいと考えています。
不正確と判定された回答を確認したところ、以下の課題が明らかになりました。
- 伝達ミスがあったためか、SQL 生成・実行を伴う質問がきて、数値の嘘をついていたこと
- 情報ソースの範囲外の質問がきて、回答ができなかったこと（ニーズに合う関連文書がなかったこと）
- 情報ソースとして使った PDF 資料が広告代理店向けの説明を目的としていたため、担当者レベルで必要な詳細な情報が含まれていなかったこと。例えば、CV テストの細かい仕様が不足していたため、実用的な回答を生成することが困難でした
  - ここはクリティカルな部分で、単に情報ソースを増やすだけでは解決しない問題でした

振り返り

LLM を使った業務支援では、インパクトを出すこと・業務に組み込むこと・実績を重ねることが重要だと感じました。
最後の「実績を重ねる」点ですが、「何となく使われる」ではなく「価値があるから使われる」に持っていかないと、継続利用は難しいと感じました。
継続利用を目指すには、依頼系も捌けるツールに成長させて、問い合わせの主要なケースに対応することだと考えています。

まとめ

LLM を使った広告問い合わせ対応の話を紹介しました。
明日の Gunosy Advent Calendar 2024 では skozawa さんが「データ基盤のコストをAmazon S3 Intelligent-Tieringで削減する」についてお話します。お楽しみに！

CloudFront + S3 Object LambdaでHTMLをPDFに変換して配信する

2024-12-06T12:00:00+09:00

この記事はGunosy Advent Calendar 2024の6日目の記事です。昨日の記事はk.oshiroさんの「LLMでの業務支援まとめ動画作成効率化プロジェクトの話」でした。

はじめに
S3 Object Lambdaとは
- Lambda@Edgeとの違い
実装
おわりに

はじめに

こんにちは。プロダクト開発部Adsチームのjohnmanjiroです。普段は広告配信のAPIや管理画面を開発しています。

先日、S3上に保存したHTMLファイルからPDFを生成して表示する機能を実装する機会がありました。この記事では、その際に利用したS3 Object Lambdaについてご紹介します。

この機能の実装にあたり、AWSの以下のブログを参考にしています。

aws.amazon.com

S3 Object Lambdaとは

S3 Object Lambdaは、S3に対するGET、HEAD、LISTリクエストのレスポンスをLambdaで加工することができる機能です。 S3からのレスポンスが返ってくる際に間にLambdaが挟まっているイメージです。

通常であればS3上のHTMLをPDFに変換して配信するには、変換したPDFをまたS3などに保存する必要があり、これは余分にコストがかかってしまいます。それに対してS3 Object Lambdaであれば、「HTMLをPDFに変換するLambda関数」を用意することで、S3上のHTMLファイルのレスポンス時に変換処理を挟み、PDFファイルを返すということが可能になります。

Lambda@Edgeとの違い

似たことを実現する選択肢として、Lambda@Edgeがあります。Lambda@EdgeはCloudFrontの機能で、エッジロケーションでLambdaを実行することができるものです。しかし、リージョンがバージニア北部に限定されるなど、利用にはいくつかの制限があります。

それに対してS3 Object LambdaはCloudFrontを前提としない機能であることから、Lambda@Edgeのような制限を受けずに利用することができます。たとえば（詳細は後述しますが）、S3 Object Lambdaでは専用のプライベートなアクセスポイントが用意されるため、VPC内のリソースからS3上のファイルを変換したものを取得したい場合にもVPCから外に出る必要がありません。

実装

今回の構成

今回の機能はS3上に保存されているHTMLをPDFに変換してCloudFront経由で配信するというもののため、以下のような構成になります。

S3バケット
- HTMLファイルが保存されているバケット
S3アクセスポイント
- S3 Object LambdaがS3上のファイルを取得する際に利用するアクセスポイント
Lambda
- HTMLを取得してPDFに変換するLambda関数
- 署名付きURLを用いてS3上のファイルを取得する
  - S3に対する権限は不要
S3 Object Lambdaアクセスポイント
- S3 Object Lambdaを経由してファイルを取得するためのアクセスポイント
CloudFront
- PDFをユーザーに配信するためのCloudFront

必要な設定

前述の構成を実現するためのTerraformのコードは以下のようになります。

S3バケット

HTMLを保管するS3バケットと、それに対するS3アクセスポイントのアクセスを許可するバケットポリシーを用意します。

resource "aws_s3_bucket" "html_assets" {
  bucket = "html-assets"
}

resource "aws_s3_bucket_policy" "html_assets" {
  bucket = aws_s3_bucket.html_assets.id
  policy = data.aws_iam_policy_document.html_assets_bucket.json
}

data "aws_iam_policy_document" "html_assets_bucket" {
  statement {
    effect = "Allow"
    principals {
      type        = "AWS"
      identifiers = ["*"]
    }
    actions = ["*"]
    resources = [
      aws_s3_bucket.html_assets.arn,
      "${aws_s3_bucket.html_assets.arn}/*",
    ]
    condition {
      test     = "StringEquals"
      variable = "s3:DataAccessPointAccount"
      values = [
        local.account_id,
      ]
    }
  }
}

S3アクセスポイント

次に、作成したバケットに対するS3アクセスポイントを作成します。このアクセスポイントはCloudFrontを経由してS3 Object Lambdaから利用されるため、それらを許可するポリシーを用意します。

resource "aws_s3_access_point" "html_assets" {
  bucket = aws_s3_bucket.html_assets.id
  name   = "html-assets"
}

resource "aws_s3control_access_point_policy" "html_assets" {
  access_point_arn = aws_s3_access_point.html_assets.arn
  policy           = data.aws_iam_policy_document.html_assets_access_point.json
}

data "aws_iam_policy_document" "html_assets_access_point" {
  statement {
    effect = "Allow"
    principals {
      type        = "Service"
      identifiers = ["cloudfront.amazonaws.com"] # CloudFrontを許可
    }
    actions = [
      "s3:*",
    ]
    resources = [
      aws_s3_access_point.html_assets.arn,
      "${aws_s3_access_point.html_assets.arn}/object/*",
    ]
    condition {
      test     = "ForAnyValue:StringEquals"
      variable = "aws:CalledVia"
      values   = ["s3-object-lambda.amazonaws.com"] # S3 Object Lambdaを許可
    }
  }
}

Lambda

ここでは、Lambda本体と、それに付随するポリシーを用意します。Lambdaの権限に関しては、S3 Object Lambdaに関する部分以外は省略しています。

resource "aws_lambda_function" "convert_pdf" {
  s3_bucket     = "deploy_resources"
  s3_key        = "lambda/convert-pdf/package.zip"
  function_name = "convert-pdf"
  handler       = "index.handler"
  runtime       = "nodejs20.x"
  role          = aws_iam_role.convert_pdf_lambda.arn

  memory_size = 2048
  timeout     = 10
}

resource "aws_iam_role" "convert_pdf_lambda" {
  name = "lambda.convert-pdf"
}

# S3 Object Lambdaとして利用する際に必要
resource "aws_iam_role_policy_attachment" "convert_pdf_s3_object_lambda_execution" {
  role       = aws_iam_role.convert_pdf_lambda.name
  policy_arn = "arn:aws:iam::aws:policy/service-role/AmazonS3ObjectLambdaExecutionRolePolicy"
}

# CloudFrontからS3 Object Lambdaアクセスポイントを経由して利用されるため必要
resource "aws_lambda_permission" "allow_cloudfront_call_convert_pdf" {
  statement_id  = "lambda-allow-cloudfront"
  action        = "lambda:InvokeFunction"
  function_name = aws_lambda_function.convert_pdf.function_name
  principal     = "cloudfront.amazonaws.com"
}

S3 Object Lambdaアクセスポイント

S3 Object Lambdaアクセスポイントと、CloudFrontからのアクセスを許可するポリシーを用意します。

resource "aws_s3control_object_lambda_access_point" "pdf_converter" {
  name = "pdf-converter"

  configuration {
    supporting_access_point = aws_s3_access_point.pdf_converter.arn

    transformation_configuration {
      actions = ["GetObject"]
      content_transformation {
        aws_lambda {
          function_arn = aws_lambda_function.convert_pdf.arn
        }
      }
    }
  }
}

resource "aws_s3control_object_lambda_access_point_policy" "pdf_converter" {
  name   = aws_s3control_object_lambda_access_point.pdf_converter.name
  policy = data.aws_iam_policy_document.pdf_converter_object_lambda_access_point.json
}

data "aws_iam_policy_document" "pdf_converter_object_lambda_access_point" {
  statement {
    effect = "Allow"
    principals {
      type        = "Service"
      identifiers = ["cloudfront.amazonaws.com"]
    }
    actions = [
      "s3-object-lambda:Get*",
    ]
    resources = [
      aws_s3control_object_lambda_access_point.pdf_converter.arn,
    ]
    condition {
      test     = "StringEquals"
      variable = "aws:SourceArn"
      values   = [aws_cloudfront_distribution.pdf_converter.arn]
    }
  }
}

CloudFront

最後にCloudFrontを作成します*1。オリジンにはS3 Object Lambdaアクセスポイントを指定します。

また、S3 Object Lambdaアクセスポイントはパブリックにすることはできません。そのため、CloudFrontのオリジンアクセスコントロールを利用してオリジンに対するリクエストを認証しています。

resource "aws_cloudfront_distribution" "pdf_converter" {
  origin {
    domain_name              = "${aws_s3control_object_lambda_access_point.pdf_converter.alias}.s3.${local.region}.amazonaws.com"
    origin_id                = "${aws_s3control_object_lambda_access_point.pdf_converter.alias}.s3.${local.region}.amazonaws.com"
    origin_access_control_id = aws_cloudfront_origin_access_control.pdf_converter.id
  }
  # 省略
}

resource "aws_cloudfront_origin_access_identity" "pdf_converter" {
  name                              = "pdf-converter"
  origin_access_control_origin_type = "s3"
  signing_behavior                  = "always"
  signing_protocol                  = "sigv4"
}

これで、今回の機能を実現するための設定が完了しました。

Lambdaの実装

最後にLambdaの実装について説明します。

前項でのLambdaの設定で、S3に対する権限が渡されていないことに気づかれた方もいるかと思います。これは、S3 Object LambdaがS3上のファイルを取得する際に、S3から署名付きURLが発行され、それを利用してファイルを取得するためです。そのため、LambdaにS3に対する権限を付与する必要はなく、実装は以下のようになります。

import axios from "axios";
import { S3Client, WriteGetObjectResponseCommand } from "@aws-sdk/client-s3";

// https://docs.aws.amazon.com/ja_jp/AmazonS3/latest/userguide/olap-event-context.html
interface ObjectContext {
  inputS3Url: string;
  outputRoute: string;
  outputToken: string;
}

export const handler = async (event) => {
  const context: ObjectContext = event.getObjectContext;
  const { inputS3Url, outputRoute, outputToken } = context;
  // 署名付きURLを利用してS3からHTMLを取得
  const presignedResponse = await axios.get(inputS3Url);
  const html = presignedResponse.data;

  // HTMLをPDFに変換
  const pdf = await convertToPDF(html);
  const s3 = new S3Client();
  // PDFとしてレスポンスを返す
  const command = new WriteGetObjectResponseCommand({
    RequestRoute: outputRoute,
    RequestToken: outputToken,
    ContentType: "application/pdf",
    Body: pdf,
  });
  await s3.send(command);
  return;
};

おわりに

この記事ではS3 Object Lambdaを利用してHTMLをPDFに変換して配信する方法についてご紹介しました。作成したCloudFront経由でアクセスすることでPDFとして取得することができます。また、作成したCloudFrontを経由しなければ通常のHTMLとして取得することも可能です。

S3のレスポンスを柔軟に加工することができるため、他にも様々な活用方法が考えられます。ぜひお試しください！

明日はtakujiさんの「LLMを使った広告問い合わせ対応の話」です！お楽しみに！

*1:余談ですが、S3上での暗号化にKMSを利用している場合にはKMS側でCloudFrontを許可する設定も必要です。

Android Push 通知の Tips

2024-12-04T12:00:00+09:00

こんにちは。Android アプリ開発担当の nagayama（@nagayan_dev）です。
この記事は Gunosy Advent Calendar 2024 の 4 日目の記事です。 3 日目の記事は takuji さんの広告キャンペーン単位で A/B テストを行った話でした。

今回は Android の Push 通知の Tips をまとめましたので、その内容をお伝えします。

はじめに
配信時の Tips
- メッセージの優先度（priority）
  - アプリスタンバイバケット
アプリで通知する時の Tips
- 通知チャンネル
- 通知
まとめ

はじめに

Android アプリでは、ユーザーとのコミュニケーション手段として「Push通知」が広く利用されています。この機能はAndroidの初期から存在し、現在でも多くのアプリで欠かせないものとなっています。弊社が提供しているキュレーションアプリ「グノシー」や「auサービスToday」でも、朝昼等の定時通知や速報通知といった形で活用しています。

今回は、Push 通知に関する分かりにくいパラメータの解説や、実践で役立つノウハウをまとめた Tips をご紹介します。

配信時の Tips

Firebase Cloud Messaging ( 以下 FCM ) を用いて Push 通知を送っています。FCM では「通知メッセージ」と「データメッセージ」の 2 タイプのメッセージがあります。弊社では「データメッセージ」で送信をしています。

メッセージの優先度（priority）

FCM のメッセージ配信の優先度を設定するパラメータ priority があります。アプリ実装で言えば、FirebaseMessagingService を継承した Service クラスの onMessageReceived メソッドに「いつ通知されるか」の設定になります。設定値は下記の 2 種類があります。

種別	概要
標準（normal）	端末がスリープになっていない場合または、スリープ解除時に通知を配信する。
高（high）	スリープ状態に関わらず、即時配信する。

firebase.google.com

通常であれば 標準 の設定にしますが、緊急性の高い通知を送る場合は 高 に設定します。

またメッセージの優先度を 高 に設定している場合、その優先度を下げられる場合があります。その 1 つが「アプリスタンバイバケット」です。

アプリスタンバイバケット

アプリスタンバイバケットは Android 9 以降に入った機能です。システムがアプリの利用頻度に応じて、自動的に 5 段階で評価を付けます。以下がその 5 段階の評価です。

評価値	概要	FCM 制限
アクティブ（active）	使用中であるか最近使用されたアプリ	制限なし
ワーキングセット（working set）	定期的に使用されているアプリ	制限なし
高頻度（frequent）	毎日ではないが、よく使用されているアプリ	高い優先度 10 件/日
低頻度（rare）	あまり使用されていないアプリ	高い優先度 5 件/日
制限付き（restricted）	システムリソースを大量に消費するか、望ましくない動作を引き起こす可能性があるアプリ	高い優先度 5 件/日

※ 制限付き（restricted） は Android 12 で追加されたため、それ未満では設定されません。

developer.android.com

自分のアプリがどの設定状態になっているかは、「開発者向けオプション > スタンバイ状態のアプリ」から確認が可能です。

メッセージの優先度はアプリスタンバイバケットの状態に応じて制限が掛けられます。 高頻度（frequent） から 制限付き（restricted） の低い設定になっている場合、 1 日に高 で通知できる件数が制限がされます。上限を超えた場合は 通常 の設定で配信されるようになります。

アプリで通知する時の Tips

通知チャンネル

Android 8.0 以降では全ての通知をチャンネルごとに設定します。表示や通知音の設定ができ、そのチャンネルを利用すれば全て同じ設定で通知することができます。通知チャンネルの必須パラメータは、「チャンネルID」「チャンネルの説明文」「メッセージの重要度」の 3 つになります。

developer.android.com

メッセージの重要度（importance）

メッセージの重要度（importance）とは「ユーザーにどう通知を表示するか」の設定です。5 つの値から選択するものになります。

設定値	ステータスバーに表示	音	備考
緊急（IMPORTANCE_HIGH）	○	○	ヘッドアップ通知あり
高（IMPORTANCE_DEFAULT）	○	○
中（IMPORTANCE_LOW）	○	×
低（IMPORTANCE_MIN）	×	×
なし（IMPORTANCE_NONE）	×	×	通知シェードにも表示なし。通知設定OFF時の値。

「通知表現の強さ」を設定するパラメータとも言えます。高ければそれだけユーザーの目につきやすい反面、嫌悪感を感じて通知を OFF にされてしまうリスクもあります。

余談ですが、この importance と同様なパラメータとして、Android 8.0 未満には priority がありました[参考]。昔から Android アプリを開発していると未だに importance のことを priority と呼んでしまうことがあるため、先ほどのメッセージの優先度と混同してしまう人もいます。

通知設定

端末で通知を受け取るかどうかの設定は「設定 > アプリ」より対象のアプリを選択し、「通知」から確認ができます。通知設定は、そもそも通知自体を受け取るかどうかの「すべての通知」の設定（①）と、各通知チャンネルごとの設定（②）があります。

それぞれの通知設定を取得する方法は下記になります。

① すべての通知設定

Android 4.4 以上から取得が可能です。

val manager = NotificationManagerCompat.from(context)
val isEnabled = manager.areNotificationsEnabled()

② 通知チャンネルごとの設定

Android 8.0 以上から取得が可能です。設定が OFF の状態で「メッセージの重要度（importance）」を取得すると IMPORTANCE_NONE が返却されます。設定しているかどうかはこの値と比較をします。

val manager = NotificationManagerCompat.from(context)
val importance = manager.getNotificationChannel(channelIdStr)?.importance ?: return false
val isEnabled = importance != NotificationManager.IMPORTANCE_NONE

残念ながら設定が切り替わったタイミングは検知することができません。設定状態が知りたい場合は、アプリを起動・操作をしているタイミングでこれらの設定を読み取る必要があります。

メッセージの最大の表示件数を設定する

違う通知 ID でメッセージをたくさん送信してしまうと通知シェードに大量のメッセージが表示されてしまい、ユーザーに悪い印象を与えます。メッセージの最大表示件数を設定する場合は、アプリの実装が必要になります。

実装例はこちらです。

val targetGroupKey = "target_group_key"
val notificationManager = this.applicationContext.getSystemService(Context.NOTIFICATION_SERVICE) as NotificationManager
val targetGroupNotifications = notificationManager
  .activeNotifications
  .filter {
    it.notification.group != null && targetGroupKey.contains(it.notification.group)
  }
val size = targetGroupNotifications.size
if (size >= MAX_DISPLAY_COUNT) {
  targetGroupNotifications
    .sortedByDescending { it.postTime } // 古い順に並べる
    .subList(MAX_DISPLAY_COUNT - 1, size)
    .forEach {
      // 上限を超えたものを削除する
      notificationManager.cancel(it.id)
    }
}

NotificationManager から表示をしている通知のリスト activeNotifications を取得し、その中から対象の通知グループをキーを用いて探します。対象の通知グループのメッセージが上限数を超えていた場合、古い順に並べた上で上限を超えたものを NotificationManager の cancel で削除をします。これにより例えば上限数を 3 と設定した場合、4 つ目の通知の前にこの処理を実行すると 1 番古い通知が削除されて 3 つ目の通知として通知できるようになります。

通知

最後に簡単ですが通知に関するパラメータです。主な設定パラメータは下記になります。

概要	メソッド
1 行目のテキスト	`setContentTitle(CharSequence title)`
2 行目のテキスト	`setContentText(CharSequence text)`
小さいアイコン	`setSmallIcon(IconCompat icon)` 又は `setSmallIcon(int icon)`
大きいアイコン	`setLargeIcon(Bitmap icon)` ※1 又は `setLargeIcon(Icon icon)`
通知押下時のIntent	`setContentIntent(PendingIntent intent)`
通知グループ	`setGroup(String groupKey)`
表示時間	`setTimeoutAfter(long durationMs)` ※2

※1. setLargeIcon(Bitmap icon) では大きい画像は 320dp x 320dp にリサイズされます
※2. Android 8.0 以上

まとめ

Push 通知に関する Tips をご紹介をしました。Push 通知単体だけの設定パラメータだけでなく、デバイスの状態や設定に影響されるパラメータもあるため、注意が必要です。長い歴史があるだけに難易度が高くなってきていますが、しっかり理解をして上手く活用しましょう。

明日は koki さんが LLMでの業務支援についてお話します。お楽しみに！

広告キャンペーン単位 A/B テストの話

2024-12-03T12:25:00+09:00

こんにちは。ML チームの takuji です。だんだん寒くなってきて、お鍋が食べたくなる季節になってきましたね。

こちらの記事は Gunosy Advent Calendar 2024 の 3 日目の記事です。

本記事では、広告キャンペーン単位で A/B テストを行った話を書きたいと思います。

背景
広告キャンペーン単位 A/B テストとは
A/B テストでブレをなくすために
より等しい条件での比較をするために
どのぐらいのブレがあるのか
まとめ

背景

弊社のニュースアプリに広告主から出稿される広告は、広告キャンペーンという単位で管理されています。
- ここでいう広告は、グノシー、ニュースパス、auサービスTodayに配信される運用型広告などが該当します。
- 広告キャンペーンとは、広告を管理するための単位で、予算やターゲットなどを設定します。
運用型広告には自動入札機能があり、ユーザごとに入札価格が自動で最適化されます。
- その裏では、機械学習モデルが動いていて、広告主の設定に合わせて効果的な配信が可能となっています。
広告の A/B テストは、ユーザ単位で行われることが一般的かなと思いますが、いくつか課題があります。
- 例えば、機械学習モデルの新旧での比較を行う場合、広告の予算が共通であるために他方が不利になる可能性があります。
- 他には、その広告に新旧の機械学習モデルのログが混在してしまうため、正確な比較ができない可能性があります。
これらの課題を対処したく、弊社では「広告キャンペーン単位 A/B テスト」を導入しています。

広告キャンペーン単位 A/B テストとは

名前の通り、広告キャンペーン単位で A/B テストを行うことです。
特に考慮することなく、A/B テストが可能かというとそうではありません。
- 広告キャンペーン数がユーザ数と比べると極端に少ないため、サンプル数不足になりやすいです。
- サンプル数が少ないと、広告数値（例: eCPM）がブレてしまい、評価が難しくなります。

A/B テストでブレをなくすために

A/B テストにおいて、ノイズ（ランダムなばらつき）が発生することは避けられません。
ノイズによってシグナル（本来検出したい効果）を誤って解釈してしまう可能性があるため、ノイズを抑える工夫が必要です。
具体的には、「シグナル」を正確に捉えるために、共変量バランスを保つようにして、ノイズを小さくします。
詳しくは、https://developers.cyberagent.co.jp/blog/archives/47637/ を参考にしてください。
実際に社内でも、広告データを使って以下の手法で実験を行いました。
- 純粋なランダム探索
- 参考記事に登場する「共変量バランスを揃える再ランダム化」という手法（以下、共変量を揃える探索）
  - 広告キャンペーンのメタデータを使って共変量バランスを閾値以下になるようにします。
- 実績値を使った探索
  - 実績値を使うため、既存の広告キャンペーンしか対象にできない点に注意が必要です。
  - 新規の広告キャンペーンには適用できないため、どの施策でも使えるわけではありません。
良し悪しでいうと、実績値を使った探索 > 共変量を揃える探索 > 純粋なランダム探索という結果になりました。
- 共変量バランスを揃えるだけでは、なかなか実績値のブレを抑えることができませんでした。
そのため、実績値を使った探索を採用して、広告キャンペーン単位で A/B テストを行うことにしました。
- 既存キャンペーンしか A/B 対象にできないが、群間の水準が合うのではあれば、実績値を使う価値はあるという判断です。

より等しい条件での比較をするために

広告キャンペーン単位で A/B テストを成立させるためには、工夫が必要です。
以下に、広告キャンペーン単位で A/B テストを行うための工夫を紹介します。
- 対象となる広告キャンペーンを決めるために、基準日を設けて、その日に稼働している広告キャンペーンを対象とします。
- 各群の広告キャンペーン数の差分が限りなく小さくなるようにします。
  - 例えば、基準日から翌日にかけて、広告キャンペーンが停止してしまう可能性があるため、それを考慮して調整します。
- 各群で実績値（例: eCPM）を出して、その差分が N %以内となるようにします。
- 疑似コードで書くと以下のようになります。
上記の工夫を踏まえて A/B 割り当て調整自体は make コマンドを叩けば、自動で行われるようにしています。
- 数百万回の試行を重ねて、条件をクリアした 100個程度の ab key と実績値を作成します。
  - ab key は、広告キャンペーンを A/B に割り当てるためのキーです。
作成されたデータをスプレッドシートで確認し、最も良さそうな ab key を選択します。
念のために、Redash でも本番のログで集計してみて、問題なければ ab key を採用します。
- make コマンドを叩いて ab key を探索する時は、サマリーテーブルを使っているため、厳密に出せない部分があったりするためです。

実績値を使った探索の疑似コード：

# 制約値の定義
THRESHOLD_SIZE = N      # サイズの許容差
THRESHOLD_A = X        # 指標Aの許容差分
THRESHOLD_B = Y        # 指標Bの許容差分

# 群分割
ab_key = generate_random_string()  
group_a, group_b = split_group(campaigns, ab_key)

# 各群の指標を計算
a_metrics = calc_metrics(group_a)
b_metrics = calc_metrics(group_b)

# 制約チェック
if (abs(len(group_a) - len(group_b)) <= THRESHOLD_SIZE and
    calc_diff(a_metrics.value_a, b_metrics.value_a) <= THRESHOLD_A and
    calc_diff(a_metrics.value_b, b_metrics.value_b) <= THRESHOLD_B):
    # 条件を満たす群分割が見つかった

どのぐらいのブレがあるのか

上記の工夫を踏まえても、広告数値のブレはありますが、A/A 比較で差分が把握できているため、施策の優劣は比較的正確に判断できます。
広告キャンペーン数は最低でも 90個程度は必要かなと思います。
純粋なランダム探索と比べ、実績値を使うことで eCPM のブレ幅を 11.8 %から 4.2 %まで抑制できます。

まとめ

広告のユーザ単位 A/B テストに代わる方法として、広告キャンペーン単位の A/B テストを紹介しました。
明日の Gunosy Advent Calendar 2024 では nagayama さんが「Android Push 通知の Tips」についてお話します。お楽しみに！

Gunosy Tech Blog

iOSDC Japan 2025に参加・登壇してきました

iOSDC Japan 2025 とは

トークの紹介

小野が気になったトーク

「iPhone のマイナンバーカード」のすべて

【スマホの熱中症対策】ThermalState API 実践活用ガイド

吉岡が気になったトーク

SwiftUI時代のスクショ保護〜セキュアなViewの作り方〜

登壇

末尾再帰なら安心でしょ？って信じてたSwiftコードが落ちた夜(LT)

まとめ

DroidKaigi 2025 に参加してきました

DroidKaigi 2025 とは

ワークショップ

セッションの紹介

① はじめてのMaterial3 Expressive

② Androidライブラリアンの手引き：堅牢なライブラリとSDKの構築

③ スマホ新法って何？ 12 月施行？アプリビジネスに影響あるの？

まとめ

AWS Summit Japan 2025 に参加してきました

AWS Summit Japan 2025

気になったセッションのご紹介

サービス停止を防ぐコンテナ活用術: コンテナワークロードにおける高可用性設計の実践

AWS による生成 AI のセキュリティアプローチ

セキュアなソフトウェア開発ライフサイクルのための生成 AI

終わりに

NLP2025 参加報告

NLP2025 について

論文紹介

[P8-15] 逆プロンプトを用いたコールドスタート推薦

[A2-1] 大規模言語モデルにおける複数の指示追従成功率を個々の指示追従成功率から推定する

[A5-4] プロンプトに基づくテキスト埋め込みのタスクによる冗長性の違い

まとめ

「IR Hub」のロゴデザインができるまで

IR Hubとは？

1. サービスコンセプト/ターゲット

2. デザインキーワードの設定

3. サービスロゴ

1st アイデア

2nd アイデア

3rd アイデア

FIX

4. カラー選定

5. 完成

6. 最後に

try! Swift Tokyo 2025に行ってきました

はじめに

try! Swift の雰囲気

小野が気になったトーク

Swift × Android: Skipが切り拓くクロスプラットフォーム開発の未来 by yamaken

plusnineが気になったトーク

Swiftコード生成の可能性を解き放て by rockname

吉岡が気になったトーク

SwiftUI Textを使った特殊効果 by Paul Hudson

try! Swift を通して得たもの

イベントを終えて

EMConf JP 2025に参加しました

EMConf JPとは

印象に残ったセッション

基調講演「エンジニアリングマネージャーのロードマップ エンジニアリングマネジメントの4次元と生成AI時代の戦い方」 by 広木 大地

エンジニアリング価値を黒字化する、バリューベース戦略を用いた技術戦略策定の道のり by Kazuki Maeda

基調講演「n=1の経験が紡ぐエンジニアリングマネジメントの可能性」 by 岩瀬 義昌

感想

Android Jetpack Composeで破線付きテキストの作り方

はじめに

下線付きテキストの作り方

破線付きテキストの作り方

1. 破線を描く

2. 描いた破線を Text の下に表示する

まとめ

SREの役割をテックリードに委譲しました

背景

SRE の組織パターン

Gunosy での SRE のこれまでとこれから

TL が集まる会

まとめ

参考

テックリードの役割を定義しました

背景

基調講演「エンジニアリングマネージャーのロードマップエンジニアリングマネジメントの4次元と生成AI時代の戦い方」 by 広木大地

基調講演「n=1の経験が紡ぐエンジニアリングマネジメントの可能性」 by 岩瀬義昌