27 septiembre, 2012

Cloud GOOGLE


http://www.factual.com/

Factual es una plataforma abierta de datos para desarrolladores de aplicaciones que aprovecha a gran escala de agregación de datos y el intercambio de la comunidad. Nuestro objetivo es hacer que los datos sean más accesibles (es decir, la calidad más barato, más alto, menos gravado) para máquinas y desarrolladores, para impulsar y acelerar la innovación de una manera sin precedentes. Asumimos el trabajo sucio de los datos de gestión y curaduría de datos, permitiendo a los desarrolladores centrarse en mayor valor y tareas más productivas. Ofrecemos datos limpios y estructurados con transparencia completa fuente a los desarrolladores a través de ambos, descarga y acceso a la API en términos liberales.



Los Datos

Nuestros datos incluye datos completos Lugares mundial, con más de 60MM entidades en 50 países, así como inmersiones profundas en mercados verticales tales como los restaurantes de EE.UU. y los proveedores de salud de Estados Unidos. Estamos continuamente mejorando y añadiendo a nuestros datos, no dude en explorar y registrarse para empezar!

Agrega datos fácticos de muchas fuentes, incluidos los interlocutores, la comunidad de usuarios, y la web, y se aplica una sofisticada máquina de aprendizaje conjunto de tecnología para:

Extraer datos tanto estructurados como no estructurados de millones de fuentes
Limpie, estandarizar y canonizar los datos
Combinar, de-dupe, y las entidades del mapa a través de múltiples fuentes.
Animamos a nuestros socios para proporcionar cambios y aportaciones de vuelta al ecosistema de datos como una forma de moneda para reducir los costos de transacción globales a través de intercambio.



Our History

Factual was founded in 2007 by Gil Elbaz, co-founder of Applied Semantics (which launched ASI’s AdSense product). Applied Semantics was acquired by Google in 2003, and Gil continued with Google until he left in 2007 to found Factual. Gil has long believed that making data accessible will enable more innovative tools and applications. To that end, he set out to develop an open data platform in an effort to maximize data accuracy, transparency, and accessibility.

http://www.infochimps.com/

Esta página ofrece servicios a empresas para aprovechar el gran volumen de datos, esto es almacenamiento y  custodia de la información que posteriormente puede ser aprovechada para realizar data mining or data science.

Ofrecen varios tipos de plataformas como:


Components


  • Dashpot™
usted obtiene visibilidad en tiempo real y gestión de la Plataforma Infochimps y los datos que fluyen a través de él.
  • Data Delivery Service™
De destino específico soluciones ETL están siendo rápidamente reemplazados por varios nodos, de usos múltiples plataformas de integración de datos - la unión universal que conecta sistemas juntos y hace análisis de Big Data factible.
  • Cloud Hadoop
El Apache Hadoop herramientas necesarias para el análisis de grandes lotes de datos, y la elasticidad extendido por la nube y Ironfan a utilizar los recursos de manera eficiente.
  • Data Management
Databases and data storage, as a service. We are your outsourced database administrator (DBA), providing database maintenance, updates, and support.
  • Platform API
control de la plataforma y ganar visibilidad en sus datos debe ser simple.
  • Wukong™
En lugar de escribir trabajos MapReduce en nativo Java, herramientas como el cerdo, Colmena, y Wukong proporcionar experiencias más simples para escribir grandes análisis de datos scripts.



Open Source Tools

  • Ironfan™
Ironfan, la fundación de la Plataforma Infochimps, es un aprovisionamiento de sistemas, implementación y actualización de la herramienta que se construye a partir de una combinación de tecnologías patentadas y tecnologías de código abierto como Chef y niebla.
  • Wukong™
  • Wonderdog
Wonderdog es una interfaz para Hadoop. A pesar de que está específicamente diseñado para su uso con el Apache, que incluye todo lo necesario Hadoop entrada y formatos de salida para la búsqueda elástica. Es decir, que es posible saltar Pig in enteramente y escribir trabajos personalizados Hadoop si lo prefiere.

  • Swineherd



Swineherd es para ejecutar secuencias de comandos y flujos de trabajo en sistemas de ficheros.