位置:多伦多,安大略省
我们是一家人工智能研究和系统公司,正在为一种新型智能构建基础设施:这种智能是结构化的、高效的,并与数据深度集成。我们的系统在艾字节规模上运行,每天为全球一些最知名的金融、技术和工业企业处理数拍字节的数据。这些系统已经在全球组织如何使用数据来安全高效地部署人工智能方面产生了可衡量的影响。我们相信,下一代企业人工智能不会来自更大的模型,而是来自更高效的数据系统。通过推进数据表示、存储和转换的前沿,我们旨在使大规模智能创造可持续且具有适应性。我们的长期愿景是高效智能:使用更少资源学习、从更少数据中泛化、通过结构而非规模进行推理的人工智能。为实现这一目标,我们首先构建使结构化人工智能成为可能的基础数据系统。
使命
当今的人工智能不仅受限于模型设计,还受限于为其提供数据的低效性。在规模上,每一个冗余字节、每一个组织不当的数据集和每一个低效的数据路径都会减缓进展,并累积成巨大的成本、延迟和能源浪费。我们的使命是消除这种低效。我们结合信息理论、概率建模和分布式系统的新研究,设计自我优化的数据基础设施:不断改进信息表示和人工智能使用方式的系统。这个工程团队与由安德烈亚·蒙塔纳里教授(斯坦福大学)领导的研究小组紧密合作,将信息理论和学习效率的进步与大规模分布式系统相结合。我们共同相信,人工智能的下一次飞跃将来自高效系统的突破,而不仅仅是更大的模型。
您将构建的内容
全球元数据基质。帮助设计和实施支持时间旅行、模式演变和跨大规模表格数据集原子一致性的元数据基质。
自适应引擎。构建能够自主重组数据的组件,从访问模式和工作负载中学习,以最小的手动调整保持效率。
智能数据布局。开发和完善位级编码、压缩和布局策略,以每字节读取提取最大信号。
自主计算管道。为可预测扩展并适应动态负载的分布式计算系统做出贡献。
从研究到生产。将压缩和表示的新算法从研究转化为生产级实现。
作为智能的延迟。设计和优化数据路径,以最小化问题与洞察之间的时间,从而加速模型和人类的学习。
特别福利
为什么加入我们的团队?
基础研究与企业影响相结合。在科学与工程的交汇处工作,将基础研究转化为服务于艾字节规模企业工作负载的部署系统。
设计驱动的人工智能。构建定义世界如何高效创造和应用智能的基础设施。
真正的所有权。设计将支撑未来十年人工智能基础设施的原语。
高信任环境。深度技术工作,最小化官僚主义,共享使命。
持久的愿景。由NEA、贝恩资本和来自科技和商业界的各位名人支持。我们正在为几十年而非季度或产品周期构建一家世代公司。
薪酬与福利
有竞争力的薪水、有意义的股权和为顶尖表现者提供的大额奖金
灵活的休假时间加上为您和您的家人提供全面的健康保险
支持研究、出版和深度技术探索
加入我们,构建支持未来企业人工智能的基础数据系统。在这里,您将塑造使智能本身高效、结构化和持久的基础设施。
必须具备的技能
您带来的:
对分布式系统的基础理解:分区、复制和容错。
对Parquet或ORC等列式格式和低级数据编码的经验或好奇心。
熟悉元数据驱动的架构或数据查询规划。
接触或实际使用Spark、Flink或类似的云存储分布式引擎。
精通Java、Rust、Go或C++,并致力于编写干净、可靠的代码。
对压缩、熵和表示如何影响系统效率和学习的好奇心。
建设者的心态——渴望学习、改进,并以不断增长的自主性端到端交付功能。
加分技能
熟悉Iceberg、Delta Lake或Hudi。
在压缩、索引或分布式系统方面对开源项目或研究的贡献。
对数据表示如何影响人工智能训练动态和推理效率感兴趣。