27 septiembre, 2012

http://www.infochimps.com/

Esta página ofrece servicios a empresas para aprovechar el gran volumen de datos, esto es almacenamiento y  custodia de la información que posteriormente puede ser aprovechada para realizar data mining or data science.

Ofrecen varios tipos de plataformas como:


Components


  • Dashpot™
usted obtiene visibilidad en tiempo real y gestión de la Plataforma Infochimps y los datos que fluyen a través de él.
  • Data Delivery Service™
De destino específico soluciones ETL están siendo rápidamente reemplazados por varios nodos, de usos múltiples plataformas de integración de datos - la unión universal que conecta sistemas juntos y hace análisis de Big Data factible.
  • Cloud Hadoop
El Apache Hadoop herramientas necesarias para el análisis de grandes lotes de datos, y la elasticidad extendido por la nube y Ironfan a utilizar los recursos de manera eficiente.
  • Data Management
Databases and data storage, as a service. We are your outsourced database administrator (DBA), providing database maintenance, updates, and support.
  • Platform API
control de la plataforma y ganar visibilidad en sus datos debe ser simple.
  • Wukong™
En lugar de escribir trabajos MapReduce en nativo Java, herramientas como el cerdo, Colmena, y Wukong proporcionar experiencias más simples para escribir grandes análisis de datos scripts.



Open Source Tools

  • Ironfan™
Ironfan, la fundación de la Plataforma Infochimps, es un aprovisionamiento de sistemas, implementación y actualización de la herramienta que se construye a partir de una combinación de tecnologías patentadas y tecnologías de código abierto como Chef y niebla.
  • Wukong™
  • Wonderdog
Wonderdog es una interfaz para Hadoop. A pesar de que está específicamente diseñado para su uso con el Apache, que incluye todo lo necesario Hadoop entrada y formatos de salida para la búsqueda elástica. Es decir, que es posible saltar Pig in enteramente y escribir trabajos personalizados Hadoop si lo prefiere.

  • Swineherd



Swineherd es para ejecutar secuencias de comandos y flujos de trabajo en sistemas de ficheros.

No hay comentarios:

Publicar un comentario