Publishing Details
Contact & Outreach
About This Podcast
Social Media
Explore Statistics
Recent Episodes
S1E15 #15: AIとの音声対話を作る時の技術選定と工夫ポイント
AIとの音声対話を開発するにあたってどんな技術を選ぶかや、体験面で工夫するポイントを話しましたShownotes:https://nu-dialogue.github.io/j-moshi/https://www.ai-shift.co.jp/techblog/4512https://playground.zyphra.com/sign-in?redirect_url=https%3A%2F%2F…
#14: 評価駆動開発(Evaluation Driven Development)なアプローチで行うLLMエージェントの設計
Evalを主軸にLLMエージェントの設計について述べたAn Evaluation-Driven Approach to Designing LLM Agents: Process and Architectureという論文を題材に話しました。 出演者: seya(@sekikazu01) kagaya(@ry0_kaga) ## Shownotes An…
#13: 最近のTTSについて語る 〜APIサービスから音声モデル作成まで〜
seyaとkagayaの二人ともハマっていて、最近ホットなTTSサービスについて雑談しました。 Shownotes: https://voicevox.hiroshiba.jp/ https://aivis-project.com/ https://nijivoice.com/ 出演者: seya(@sekikazu01) kagaya(@ry0_kaga)
#12: 生成AIでユーザビリティ課題を見つけることができるか? - UX-LLM
生成AIでユーザビリティ課題を発見することができるかを検証したUX-LLMについて話しました。 ポッドキャストの書き起こしサービス「LISTEN」はこちら Shownotes: https://arxiv.org/abs/2411.00634v1 https://dl.acm.org/doi/pdf/10.1145/3678957.3685701 https://u-site.jp/al…
#11: API for AIの時代、Stripe Agent Toolkitについてのよもやま話
Stripe Agent Toolkitを肴にAgent向けのAPIの時代について想いを馳せました。 ポッドキャストの書き起こしサービス「LISTEN」はこちら Shownotes: Adding payments to your LLM agentic…
#10: Agent-as-a-judge 〜エージェントの評価を行うエージェント 〜
LLM-as-a-Judgeに着想を得て、エージェンティックシステムを評価するためにエージェンティックシステムを用いることを提案したAgent-as-a-Judge: Evaluate Agents with…
#9: 今流行り!?の社内v0開発に取り組んでみてる感想
Ubie社の事例に触発されて社内v0開発を始めた2人で、開発の知見や悩み、Figma…
#8: Who Validate the Validator? - 継続的な評価をアップデートする仕組み -
継続的にLLMアプリケーションの評価基準や自動評価をアップデートする仕組みであるEvalGenについて書かれた論文「Who Validates the Validators? Aligning LLM-Assisted Evaluation of LLM Outputs with Human…
#7: AIによるプロンプト最適化:Automated Prompting 〜そして評価へ〜
自動で行うプロンプトチューニング、Auto…
#6: RAG and Beyond 〜4つのレベルで理解するRAGとその先〜
今回はMicrosoftが公開したRAGタスクを4つのレベルに分類したリサーチであるRAG and…
#5: OpenAI DevDay 2024の感想 ~Prompt Caching編~
今回はOpenAI DevDay 2024で発表されたPrompt…
#4: ~Embedding first, Chunking Later~ Jina AIが提唱したLate Chunkingについて学ぶ
今回はJina AIが提唱したLate Chunkingがテーマです。 Jina AIはEmbedding model、Reranker、Semantic chunking等のAPIを公開しているRAGに取り組む上では注目の企業です。 そんなJina AIが提唱したチャンキング手法であるLate…
#3: 音声AI使ってる?最近の音声AIサービスについて雑談 〜GoogleのNotebookLMとRetell AI、個人開発〜
音声AIサービスの雑談会です。特にGoogleのNotebookLMのAudio Overview、Illuminate、Retell AI、kagayaが絶賛個人開発中の音声AIサービスについて話しました。 ポッドキャストの書き起こしサービス「LISTEN」はこちら Shownotes: NotebookLM now lets you listen to a…
#2: LLMエージェント for ソフトウェアエンジニアリングの世界
ソフトウェアエンジニアリング領域のLLMエージェント研究のサーベイ論文である、Large Language Model-Based Agents for Software Engineering: A Surveyを題材に話しました。 ポッドキャストの書き起こしサービス「LISTEN」はこちら Shownotes: Large Language Model-Based Agents…
#1: Chatbot Arenaのデータを使ってドメイン独自の評価データセットを作る
Chatbot Arenaのデータを使ってドメイン独自の評価データセットを作るという論文、Judging LLM-as-a-Judge with MT-Bench and Chatbot Arenaを題材に話しました。 ポッドキャストの書き起こしサービス「LISTEN」はこちら Shownotes: Judging LLM-as-a-Judge with MT-Bench and…
Frequently Asked Questions
AI Engineering Now has published 15 episodes since September 2024, covering topics in Technology.
AI Engineering Now is currently dormant with new episodes weekly. Average episode length is 29m.
Sign up on Grep.FM to access contact details for AI Engineering Now, including email and social media links.