Saltar al contenido principal

Haz scraping de tu primer sitio web

Convierte cualquier sitio web en datos limpios y listos para usar con LLM mediante una única llamada a la API. La skill de Firecrawl es la forma más rápida para que los agentes descubran y utilicen Firecrawl. Sin ella, tu agente no sabrá que Firecrawl está disponible.
npx skills add firecrawl/cli
Reinicia el agente después de instalar la skill. Consulta Skill + CLI para ver la configuración completa.

Haz tu primera solicitud

Copia el siguiente código, reemplaza fc-YOUR-API-KEY por tu clave de API y ejecútalo:
curl -X POST 'https://api.firecrawl.dev/v2/scrape' \
  -H 'Authorization: Bearer fc-YOUR-API-KEY' \
  -H 'Content-Type: application/json' \
  -d '{"url": "https://example.com"}'
{
  "success": true,
  "data": {
    "markdown": "# Example Domain\n\nThis domain is for use in illustrative examples...",
    "metadata": {
      "title": "Example Domain",
      "sourceURL": "https://example.com"
    }
  }
}

¿Qué puede hacer Firecrawl?

¿Por qué Firecrawl?

  • Resultados listos para LLM: Obtén markdown limpio, JSON estructurado, capturas de pantalla y más
  • Se encarga de lo difícil: Proxies, anti-bot, renderizado de JavaScript y contenido dinámico
  • Confiable: Construido para producción con alta disponibilidad y resultados consistentes
  • Rápido: Obtén resultados en segundos, optimizado para alto rendimiento

Scraping

Extrae el contenido de cualquier URL y obténlo en markdown, HTML u otros formatos. Consulta la documentación de la funcionalidad Scrape para ver todas las opciones.
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-YOUR-API-KEY")

# Extraer datos de un sitio web:
doc = firecrawl.scrape("https://firecrawl.dev", formats=["markdown", "html"])
print(doc)
Los SDK devolverán el objeto de datos directamente. cURL devolverá la carga útil exactamente como se muestra a continuación.
{
  "success": true,
  "data" : {
    "markdown": "¡Launch Week I ya está aquí! [Consulta nuestro lanzamiento del Día 2 🚀](https://www.firecrawl.dev/blog/launch-week-i-day-2-doubled-rate-limits)[💥 Obtén 2 meses gratis...",
    "html": "<!DOCTYPE html><html lang=\"en\" class=\"light\" style=\"color-scheme: light;\"><body class=\"__variable_36bd41 __variable_d7dc5d font-inter ...",
    "metadata": {
      "title": "Inicio - Firecrawl",
      "description": "Firecrawl rastrea y convierte cualquier sitio web en Markdown limpio.",
      "language": "en",
      "keywords": "Firecrawl,Markdown,Data,Mendable,Langchain",
      "robots": "seguir, indexar",
      "ogTitle": "Firecrawl",
      "ogDescription": "Convierte cualquier sitio web en datos listos para LLM.",
      "ogUrl": "https://www.firecrawl.dev/",
      "ogImage": "https://www.firecrawl.dev/og.png?123",
      "ogLocaleAlternate": [],
      "ogSiteName": "Firecrawl",
      "sourceURL": "https://firecrawl.dev",
      "statusCode": 200
    }
  }
}
La API de búsqueda de Firecrawl te permite realizar búsquedas en la web y, opcionalmente, extraer (scrape) los resultados en una sola operación.
  • Elige formatos de salida específicos (Markdown, HTML, enlaces, capturas de pantalla)
  • Elige fuentes específicas (web, noticias, imágenes)
  • Busca en la web con parámetros personalizables (ubicación, etc.)
Para más detalles, consulta la Referencia del endpoint /search.
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-TU-API-KEY")

results = firecrawl.search(
    query="firecrawl",
    limit=3,
)
print(results)
Los SDK devolverán el objeto de datos directamente. cURL devolverá el payload completo.
JSON
{
  "success": true,
  "data": {
    "web": [
      {
        "url": "https://www.firecrawl.dev/",
        "title": "Firecrawl - La API de datos web para IA",
        "description": "La API de rastreo, scraping y búsqueda web para IA. Diseñada para escalar. Firecrawl pone todo internet al alcance de agentes y desarrolladores de IA.",
        "position": 1
      },
      {
        "url": "https://github.com/mendableai/firecrawl",
        "title": "mendableai/firecrawl: Convierte sitios web completos en datos listos para LLM ... - GitHub",
        "description": "Firecrawl es un servicio de API que toma una URL, la rastrea y la convierte en Markdown limpio o datos estructurados.",
        "position": 2
      },
      ...
    ],
    "images": [
      {
        "title": "Guía de inicio rápido | Firecrawl",
        "imageUrl": "https://mintlify.s3.us-west-1.amazonaws.com/firecrawl/logo/logo.png",
        "imageWidth": 5814,
        "imageHeight": 1200,
        "url": "https://docs.firecrawl.dev/",
        "position": 1
      },
      ...
    ],
    "news": [
      {
        "title": "La startup de Y Combinator, Firecrawl, está dispuesta a pagar 1 M$ para contratar a tres agentes de IA como empleados",
        "url": "https://techcrunch.com/2025/05/17/y-combinator-startup-firecrawl-is-ready-to-pay-1m-to-hire-three-ai-agents-as-employees/",
        "snippet": "Ahora ha publicado tres nuevos anuncios en la bolsa de trabajo de YC para “solo agentes de IA” y ha reservado un presupuesto total de 1 millón de dólares para lograrlo.",
        "date": "hace 3 meses"
        "position": 1
      },
      ...
    ]
  }
}

Agente

El Agent de Firecrawl es una herramienta autónoma para la recopilación de datos web. Solo tienes que describir qué datos necesitas y buscará, navegará y los extraerá desde cualquier lugar de la web. Consulta la documentación de la funcionalidad Agent para ver todas las opciones.
curl -X POST 'https://api.firecrawl.dev/v2/agent' \
  -H 'Authorization: Bearer fc-YOUR-API-KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "prompt": "Find the pricing plans for Notion"
  }'
{
  "success": true,
  "data": {
    "result": "Notion offers the following pricing plans:\n\n1. **Free** - $0/month - For individuals...\n2. **Plus** - $10/seat/month - For small teams...\n3. **Business** - $18/seat/month - For companies...\n4. **Enterprise** - Custom pricing - For large organizations...",
    "sources": [
      "https://www.notion.so/pricing"
    ]
  }
}

Recursos