braintrustdata
diff --git a/‎braintrust-sdk/instrumentation/springai_1_0_0/src/main/java/dev/braintrust/instrumentation/springai/v1_0_0/AnthropicBuilderWrapper.java‎
Lines changed: 12 additions & 1 deletion b/‎braintrust-sdk/instrumentation/springai_1_0_0/src/main/java/dev/braintrust/instrumentation/springai/v1_0_0/AnthropicBuilderWrapper.java‎
Lines changed: 12 additions & 1 deletion
diff --git a/‎braintrust-sdk/instrumentation/springai_1_0_0/src/main/java/dev/braintrust/instrumentation/springai/v1_0_0/OpenAIBuilderWrapper.java‎
Lines changed: 2 additions & 2 deletions b/‎braintrust-sdk/instrumentation/springai_1_0_0/src/main/java/dev/braintrust/instrumentation/springai/v1_0_0/OpenAIBuilderWrapper.java‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎btx/build.gradle‎
Lines changed: 78 additions & 0 deletions b/‎btx/build.gradle‎
Lines changed: 78 additions & 0 deletions
diff --git a/‎btx/spec/README.md‎
Lines changed: 9 additions & 0 deletions b/‎btx/spec/README.md‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎btx/spec/llm_span/README.md‎
Lines changed: 3 additions & 0 deletions b/‎btx/spec/llm_span/README.md‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎btx/spec/llm_span/anthropic/attachments.yaml‎
Lines changed: 47 additions & 0 deletions b/‎btx/spec/llm_span/anthropic/attachments.yaml‎
Lines changed: 47 additions & 0 deletions
diff --git a/‎btx/spec/llm_span/anthropic/messages.yaml‎
Lines changed: 34 additions & 0 deletions b/‎btx/spec/llm_span/anthropic/messages.yaml‎
Lines changed: 34 additions & 0 deletions
diff --git a/‎btx/spec/llm_span/anthropic/streaming.yaml‎
Lines changed: 36 additions & 0 deletions b/‎btx/spec/llm_span/anthropic/streaming.yaml‎
Lines changed: 36 additions & 0 deletions
diff --git a/‎btx/spec/llm_span/google/attachments.yaml‎
Lines changed: 44 additions & 0 deletions b/‎btx/spec/llm_span/google/attachments.yaml‎
Lines changed: 44 additions & 0 deletions
diff --git a/‎btx/spec/llm_span/google/generate_content.yaml‎
Lines changed: 34 additions & 0 deletions b/‎btx/spec/llm_span/google/generate_content.yaml‎
Lines changed: 34 additions & 0 deletions
@@ -1,5 +1,6 @@
 package dev.braintrust.instrumentation.springai.v1_0_0;
 
+import com.fasterxml.jackson.databind.JsonNode;
 import com.fasterxml.jackson.databind.node.ArrayNode;
 import com.fasterxml.jackson.databind.node.ObjectNode;
 import dev.braintrust.instrumentation.InstrumentationSemConv;
@@ -74,7 +75,17 @@ static void tagSpanRequest(
         for (Message msg : prompt.getInstructions()) {
             ObjectNode msgNode = BraintrustJsonMapper.get().createObjectNode();
             msgNode.put("role", msg.getMessageType().getValue().toLowerCase());
-            msgNode.put("content", msg.getText());
+            String text = msg.getText();
+            try {
+                JsonNode parsed = BraintrustJsonMapper.get().readTree(text);
+                if (parsed.isArray() || parsed.isObject()) {
+                    msgNode.set("content", parsed);
+                } else {
+                    msgNode.put("content", text);
+                }
+            } catch (Exception e) {
+                msgNode.put("content", text);
+            }
             messages.add(msgNode);
         }
         String model = null;
 
@@ -1,5 +1,6 @@
 package dev.braintrust.instrumentation.springai.v1_0_0;
 
+import com.fasterxml.jackson.databind.JsonNode;
 import com.fasterxml.jackson.databind.node.ArrayNode;
 import com.fasterxml.jackson.databind.node.ObjectNode;
 import dev.braintrust.instrumentation.InstrumentationSemConv;
@@ -76,8 +77,7 @@ static void tagSpanRequest(
             // If the content text is a JSON array or object (e.g. multi-part content with images),
             // emit it as a structured JSON node rather than a plain string.
             try {
-                com.fasterxml.jackson.databind.JsonNode parsed =
-                        BraintrustJsonMapper.get().readTree(text);
+                JsonNode parsed = BraintrustJsonMapper.get().readTree(text);
                 if (parsed.isArray() || parsed.isObject()) {
                     msgNode.set("content", parsed);
                 } else {
 
@@ -0,0 +1,78 @@
+plugins {
+    id 'java'
+}
+
+java {
+    toolchain {
+        languageVersion = JavaLanguageVersion.of(17)
+    }
+}
+
+repositories {
+    mavenCentral()
+    mavenLocal()
+}
+
+dependencies {
+    // Braintrust SDK (local project dependencies)
+    testImplementation project(':braintrust-sdk')
+    testImplementation project(':braintrust-sdk:instrumentation:openai_2_8_0')
+    testImplementation project(':braintrust-sdk:instrumentation:anthropic_2_2_0')
+    testImplementation project(':braintrust-sdk:instrumentation:genai_1_18_0')
+    testImplementation project(':braintrust-sdk:instrumentation:langchain_1_8_0')
+    testImplementation project(':braintrust-sdk:instrumentation:springai_1_0_0')
+
+    // Jackson for JSON processing
+    testImplementation 'com.fasterxml.jackson.core:jackson-databind:2.16.1'
+
+    // OpenAI SDK
+    testImplementation 'com.openai:openai-java:2.8.1'
+
+    // Anthropic SDK
+    testImplementation 'com.anthropic:anthropic-java:2.10.0'
+
+    // Gemini SDK
+    testImplementation 'org.springframework.ai:spring-ai-google-genai:1.1.0'
+
+    // Spring AI (OpenAI + Anthropic providers)
+    testImplementation 'org.springframework.ai:spring-ai-openai:1.1.3'
+    testImplementation 'org.springframework.ai:spring-ai-anthropic:1.1.3'
+    testRuntimeOnly 'org.springframework:spring-webflux:6.2.3'
+    testRuntimeOnly 'io.projectreactor.netty:reactor-netty-http:1.2.3'
+    testImplementation 'org.apache.httpcomponents.client5:httpclient5:5.3.1'
+
+    // LangChain4j
+    testImplementation 'dev.langchain4j:langchain4j:1.9.1'
+    testImplementation 'dev.langchain4j:langchain4j-http-client:1.9.1'
+    testImplementation 'dev.langchain4j:langchain4j-open-ai:1.9.1'
+
+    // OpenTelemetry
+    testImplementation 'io.opentelemetry:opentelemetry-api:1.54.1'
+
+    // YAML parsing for spec files
+    testImplementation 'org.yaml:snakeyaml:2.3'
+
+    // Test framework
+    testImplementation(testFixtures(project(":test-harness")))
+    testImplementation "org.junit.jupiter:junit-jupiter:${rootProject.ext.junitVersion}"
+    testImplementation "org.junit.jupiter:junit-jupiter-params:${rootProject.ext.junitVersion}"
+    testImplementation "io.opentelemetry:opentelemetry-sdk:${rootProject.ext.otelVersion}"
+    testRuntimeOnly 'org.slf4j:slf4j-simple:2.0.17'
+    testRuntimeOnly 'org.junit.platform:junit-platform-launcher'
+}
+
+test {
+    useJUnitPlatform()
+    workingDir = rootProject.projectDir
+    testLogging {
+        events "passed", "skipped", "failed"
+        showStandardStreams = true
+        exceptionFormat "full"
+    }
+
+    // Pass -Pbtx.spec.filter=<glob> to pre-filter which specs are executed before JUnit runs.
+    // Example: ./gradlew btx:test -Pbtx.spec.filter=openai
+    if (project.hasProperty('btx.spec.filter')) {
+        systemProperty 'btx.spec.filter', project.property('btx.spec.filter')
+    }
+}
@@ -0,0 +1,9 @@
+# Braintrust Spec
+
+Cross language specs for implementing a Braintrust SDK.
+
+Contains:
+
+- markdown files describing complex features
+- yaml describing end-to-end tests and assertions
+- yaml describing cross-language constants (envars, string attributes)
@@ -0,0 +1,3 @@
+# llm span end-to-end tests
+
+TODO: document this
@@ -0,0 +1,47 @@
+name: attachments
+type: llm_span_test
+provider: anthropic
+endpoint: /v1/messages
+enabled_runners: ["java"]
+requests:
+  - model: claude-haiku-4-5-20251001
+    temperature: 0.0
+    max_tokens: 128
+    messages:
+      - role: user
+        content:
+          - type: text
+            text: What color is this image?
+          - type: image
+            source:
+              type: base64
+              media_type: image/png
+              # 1x1 red pixel
+              data: iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAADUlEQVR42mP8z8DwHwAFBQIAX8jx0gAAAABJRU5ErkJggg==
+expected_brainstore_spans:
+  - metrics:
+      tokens: !fn is_non_negative_number
+      prompt_tokens: !fn is_non_negative_number
+      completion_tokens: !fn is_non_negative_number
+    metadata:
+      model: claude-haiku-4-5-20251001
+      provider: anthropic
+    span_attributes:
+      name: anthropic.messages.create
+      type: llm
+    input:
+      - role: user
+        content:
+          - type: text
+            text: What color is this image?
+          - type: image
+            source:
+              type: braintrust_attachment
+              content_type: image/png
+              filename: !fn is_non_empty_string
+              key: !fn is_non_empty_string
+    output:
+      content:
+        - text: !fn is_non_empty_string
+          type: text
+      role: assistant
@@ -0,0 +1,34 @@
+name: messages
+type: llm_span_test
+provider: anthropic
+endpoint: /v1/messages
+enabled_runners: ["python", "typescript", "java", "csharp"]
+requests:
+  - model: claude-haiku-4-5-20251001
+    temperature: 0.0
+    max_tokens: 128
+    system: "You are a helpful assistant."
+    messages:
+      - role: user
+        content: What is the capital of France?
+expected_brainstore_spans:
+  - metrics:
+      tokens: !fn is_non_negative_number
+      prompt_tokens: !fn is_non_negative_number
+      completion_tokens: !fn is_non_negative_number
+    metadata:
+      model: claude-haiku-4-5-20251001
+      provider: anthropic
+    span_attributes:
+      name: anthropic.messages.create
+      type: llm
+    input:
+      - content: What is the capital of France?
+        role: user
+      - content: "You are a helpful assistant."
+        role: system
+    output:
+      content:
+        - text: The capital of France is Paris.
+          type: text
+      role: assistant
@@ -0,0 +1,36 @@
+name: streaming
+type: llm_span_test
+provider: anthropic
+endpoint: /v1/messages
+enabled_runners: ["java"]
+requests:
+  - model: claude-haiku-4-5-20251001
+    temperature: 0.0
+    max_tokens: 128
+    system: "You are a helpful assistant."
+    messages:
+      - role: user
+        content: Count from 1 to 5.
+    stream: true
+expected_brainstore_spans:
+  - metrics:
+      time_to_first_token: !fn is_non_negative_number
+      tokens: !fn is_non_negative_number
+      prompt_tokens: !fn is_non_negative_number
+      completion_tokens: !fn is_non_negative_number
+    metadata:
+      model: claude-haiku-4-5-20251001
+      provider: anthropic
+    span_attributes:
+      name: anthropic.messages.create
+      type: llm
+    input:
+      - content: Count from 1 to 5.
+        role: user
+      - content: "You are a helpful assistant."
+        role: system
+    output:
+      content:
+        - text: !fn is_non_empty_string
+          type: text
+      role: assistant
@@ -0,0 +1,44 @@
+name: attachments
+type: llm_span_test
+provider: google
+endpoint: /v1/models/gemini-2.0-flash:generateContent
+enabled_runners: ["python", "typescript", "java", "go"]
+requests:
+  - contents:
+      - role: user
+        parts:
+          - text: What color is this image?
+          - inline_data:
+              mime_type: image/png
+              # 1x1 red pixel
+              data: iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAADUlEQVR42mP8z8DwHwAFBQIAX8jx0gAAAABJRU5ErkJggg==
+    generationConfig:
+      temperature: 0.0
+expected_brainstore_spans:
+  - metrics:
+      tokens: !fn is_non_negative_number
+      prompt_tokens: !fn is_non_negative_number
+      completion_tokens: !fn is_non_negative_number
+    metadata:
+      model: gemini-2.0-flash
+    span_attributes:
+      name: generate_content
+      type: llm
+    input:
+      model: gemini-2.0-flash
+      contents:
+        - role: user
+          parts:
+            - text: What color is this image?
+            - image_url:
+                url:
+                  content_type: image/png
+                  filename: !fn is_non_empty_string
+                  key: !fn is_non_empty_string
+                  type: braintrust_attachment
+    output:
+      candidates:
+        - content:
+            parts:
+              - text: !fn is_non_empty_string
+            role: model
@@ -0,0 +1,34 @@
+name: generate_content
+type: llm_span_test
+provider: google
+endpoint: /v1/models/gemini-2.5-flash:generateContent
+enabled_runners: ["python", "typescript", "java", "go"]
+requests:
+  - contents:
+      - role: user
+        parts:
+          - text: What is the capital of France?
+    generationConfig:
+      temperature: 0.0
+expected_brainstore_spans:
+  - metrics:
+      tokens: !fn is_non_negative_number
+      prompt_tokens: !fn is_non_negative_number
+      completion_tokens: !fn is_non_negative_number
+    metadata:
+      model: gemini-2.5-flash
+    span_attributes:
+      name: generate_content
+      type: llm
+    input:
+      model: gemini-2.5-flash
+      contents:
+        - role: user
+          parts:
+            - text: What is the capital of France?
+    output:
+      candidates:
+        - content:
+            parts:
+              - text: !fn is_non_empty_string
+            role: model
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+# llm span end-to-end tests`
	`2`	`+`
	`3`	`+TODO: document this`