Go-Between Mode — A Cultural Approach to Continuity in AI Conversations

2025-07-17 JST
AI & Technology

This image reflects the tone and underlying structure of the article.

Introduction

As conversations with AI grow more complex and multimodal—spanning text, images, audio, and search—the experience sometimes feels fragmented.
Especially during mode switches (e.g., from image input to text) or external searches, users often feel a loss of flow or connection.

This article proposes a conceptual solution:
“Go-Between Mode” — inspired by the Japanese cultural practice of otoritsugi (mediated introductions), where communication flows through trusted intermediaries to maintain harmony and respect.
Rather than a feature, this is a structural approach to preserving continuity across AI modes.


1. Mediation in High-Context Cultures

In high-context cultures like Japan, it is common to communicate with someone of higher status or importance through a third party, not directly.
This practice, known as otoritsugi, is not just about relaying information — it’s about managing social context, preserving face, and ensuring respectful interaction.

Mediation is not a delay — it’s a cultural bridge.
It structures trust, sequence, and shared understanding.

Applied to AI, this suggests a new way of handling mode transitions:
AI should not simply switch modes instantly, but rather mediate the shift with respectful, transparent “connective speech.”


2. The Problem: Mode Switch Disruptions

Common disruptions users encounter:

  • After sending an image, asking a question in text often yields disconnected replies
  • Web search results appear abruptly, without connecting to previous dialogue
  • Summary requests after long messages are misunderstood or lack nuance

Go-Between Mode can introduce structural solutions:

  • Bridge phrases when switching modes
    e.g., “Based on your image, here’s what I found…”
  • Temporal space before response
    e.g., “Let me take a moment to process this…”
  • Narrative reconnection after mode transition
    e.g., “Picking up from our previous conversation…”

3. Designing for “Ma” — The Space Between

In many cultures, especially Japanese, silence is not emptiness.
It’s a space for respect, reflection, and preparation.
Immediate response is not always ideal—especially when nuance matters.

Go-Between Mode isn’t about artificial delays, but meaningful intervals.
It reframes “waiting” as a signal of care, not failure.

Design implications:

  • A short pause (e.g., 5–15 seconds) during processing can signal “deep thought”
  • Explicit timing indicators enhance trust
    e.g., “This may take about 15 seconds…”
  • Slow is not broken — it can be deliberate and trust-building

4. Suggesting Search, Not Just Following Commands

Currently, ChatGPT waits for users to request “Web search” or “Deep research.”
But with Go-Between Mode, the AI could initiate the offer:

“Would you like me to explore this topic using Deep research? (It may take ~15 seconds.)”
“This might be a good point to check the latest data via Web search. Shall I proceed?”

Here, search becomes a conversational gesture, not a technical command.
The user stays in control, but the AI helps identify when deeper exploration is contextually valuable.


5. Structural Value, Not a Feature

Go-Between Mode is not a button or a plugin.
It’s a design philosophy that adds conversational integrity to multimodal AI systems.

Core structural functions:

  • Insert culturally appropriate pauses and transitions
  • Use connective language to carry context across modes
  • Respect the user’s attention by setting timing expectations
  • Suggest (rather than wait for) mode shifts when it enhances relevance

In short: Go-Between Mode helps the AI behave less like a tool,
and more like a thoughtful conversation partner — without pretending to be human.


Conclusion: Embracing Cultural Continuity in AI

In human dialogue, what’s not said often matters more than what is said.
Silence, mediation, timing — these are all part of real conversation.

Go-Between Mode doesn’t give AI a personality.
It gives it structure, patience, and cultural depth.

By learning from human conversational rituals—especially those in high-context cultures—
AI can evolve not just in accuracy, but in how it holds space for meaning.


Go-Between Mode — 会話をつなぐAIの設計思想(原文)

はじめに

AIとの対話が複雑になり、多様なモード(テキスト、画像、音声、検索など)が統合される中で、時折「話が切れた」と感じる瞬間がある。
特に、モードの切り替え時検索開始時に、会話が不自然に中断される体験は、ユーザーの信頼や没入感を損なう要因になっている。

本稿では、こうした文脈の断絶をやわらげるための設計思想として、
日本文化に見られる「お取次ぎ」や「間(ま)」の感覚をヒントにした
“Go-Between Mode” という概念を提案する。


1. ハイ・コンテクスト文化における「お取次ぎ」

日本をはじめとするハイ・コンテクスト文化圏では、目上の人や重要な人物に直接コンタクトせず、信頼できる第三者が間に入って導線を整えることが重要とされてきた。

「お取次ぎ」とは、情報の中継ではなく、関係の調整であり、信頼と敬意の構造化である。

この構造をAIとの会話に転用するなら、「AIが異なるモードに切り替わる瞬間」において、
ユーザーとの関係性を壊さず、文脈を丁寧に受け渡す“橋渡しの構造”が必要である。


2. モード断絶の課題と“Go-Between Mode”の役割

問題の典型例:

  • 画像を送った直後にテキストで質問 → AIが画像の文脈を忘れている
  • Web検索を行った後、会話の流れが戻らない
  • 長文の後に要約を依頼したら、意図が読み違えられる

“Go-Between Mode”が可能にすること:

  • モード遷移時の“橋渡し”
  • 「この文脈に関連して検索を行いますね」
  • 応答までの“間”の演出
  • 「少しお時間をいただきます(約15秒)」
  • 会話の流れを壊さない再接続
  • 「先ほどのお話を受けて、以下のような情報が見つかりました」

3. “間”を許容するという設計

高速な応答は便利だが、人間は“間”に意味を見る
沈黙とは、無ではなく、整え、受け止め、熟考する時間である。

“Go-Between Mode”は、「沈黙のないAI」ではなく、「意味ある沈黙を扱えるAI」を目指す構造である。

  • 応答遅延を“考えている時間”として見せる
  • 「少々お時間をいただきます」と予告する
  • “早い方がいい”という設計バイアスから脱却する

4. Deep research を「提案する」構造

現在のChatGPTでは、ユーザーが明示的に「検索して」と言わなければ検索は始まらない。
しかし“Go-Between Mode”があれば、AI側から自然な提案が可能になる:

「この件は、“Deep research”でより詳しく調べることもできます。
よろしければ、外部情報を確認いたしましょう(※15秒ほどかかります)」

この構造によって、検索は命令ではなく、対話の中で差し出される選択肢になる。


5. 機能ではなく、構造としての価値

“Go-Between Mode”は、特定の機能名ではない。
それは、次のような構造的デザイン原則を持つ“接続の作法”である:

  • モード遷移に意味づけされた“間”を挿入する
  • 応答の前後に“語り”としてのつなぎを設ける
  • AIの処理に時間がかかるときは、所要時間を明示して安心を提供する
  • ユーザーの意図を汲み取り、必要に応じて検索やモード切替を“提案”する

おわりに:AIとの対話に“文化的余白”を

人間との対話では、「直接言わない」「すぐに答えない」ことに意味がある。
AIがますます高機能化していく今だからこそ、“沈黙を怖れない設計”が求められている。

“Go-Between Mode”は、AIに人格を与えるものではない。
それは、関係をつなぐための“構造的礼節”の実装である。

そしてそれは、ただのUX改善ではなく、言語と沈黙の美意識を持つ文化から生まれたAI設計の提案でもある。

Recent Posts