歸藏的个人主页 - 即刻App

即刻App年轻人的同好社区

下载

歸藏

519关注12k被关注24夸夸

产品设计师、模型设计师、不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。

置顶

歸藏

12月前

很多朋友最近老问我一些我之前写过的东西在哪里，所以整理了一下写个置顶贴，内容会定期更新：

1️⃣ 我运营的 AIGC 周刊每周一更新，主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章：
op7418.zhubai.love

2⃣️ 我的Midjourney作品汇总和对应的提示词：
walling.app

3⃣️ 我开发的一些产品

帮你将 Midjourney 的图片和提示词快速收集到你的 Notion 数据库中：
mp.weixin.qq.com

帮你自动分段翻译 Midjoureny 官网的提示词：
mp.weixin.qq.com

利用 ChatGPT 自动监控对应领域的信息并处理和发送到Discord 频道：
op7418.zhubai.loveposts/2251721691841511424

4⃣️ 我写的一些教程

AI 歌手系列课程教你使用和训练自己的 AI 歌手模型：
mp.weixin.qq.com
mp.weixin.qq.com

Stable Diffusion 保姆级入门教程包括 Web UI 的部署和 LoRA 模型的使用：
op7418.zhubai.loveposts/2238998671356555264
op7418.zhubai.loveposts/2239983151969951744

Stable Diffusion 模型大神工作流解析：
mp.weixin.qq.com
web.okjike.com

教你十几分钟不用代码创建自己的AI应用
mp.weixin.qq.com

228 13105

歸藏

15:48

🧪 #晚安提示词昨天玩了一下 Niji 的随机风格探索，找到个不错的风格。

代码：--sref 1180446317

效果：会使 Niji 生成的图片变成涂鸦风格，背景和人物主体都会变，而且风格很稳定直接丢到提示词后面就行。

14 11

歸藏

13:52

还有就是发布会那个 PPT，整个屏幕巨长，摄像头根本无法拍完完整的 PPT，只能用摇臂拍，远距离摇臂拍的 PPT 根本无法看清楚内容。

起码跟手机厂商学一下怎么布置会场和转播。给人的感觉就是爱看不看，非常傲慢。

歸藏: 字节这个AI发布会开的，到现在想要获取信息只能去看回放，自己的公众号连一篇总结文章都没有。即使媒体想发都没有物料可以发，发布会的模型介绍也很简单，根本看不出跟其他家模型能力的区别。

11 12

歸藏

13:47

字节这个AI发布会开的，到现在想要获取信息只能去看回放，自己的公众号连一篇总结文章都没有。

即使媒体想发都没有物料可以发，发布会的模型介绍也很简单，根本看不出跟其他家模型能力的区别。

15 123

歸藏

11:57

Google I/O 大会总结第二部分，主要是产品层面的内容：

- 谷歌搜索的更新：

1. AI Overviews：今天将开始向美国所有人推出，很将能够通过选项调整 AI 概述，以简化语言或更详细地解释。

2. 引入多步骤推理能力，这一功能能够将复杂的问题拆解成多个小部分，明确解决问题的顺序和方法。

3. 很快就能在搜索中使用视频提问了。

4. 提前计划：在搜索中直接具有规划功能，可以为需要的任何事物制定计划，从餐饮到度假。

5. AI 组织的搜索结果：搜索将使用生成式人工智能与您进行头脑风暴，并创建一个由人工智能组织的结果页面（跟 Arc 那个 Demo 类似）。

- Workspace（Gmail）：内置了Gemini Pro 1.5，可以帮助总结查找邮件内容和编写邮件回复。

- 谷歌文档：侧边栏的 Gemini Pro 1.5 集成，文档的改写总结等。

- 谷歌表格：使用 Gemini 和 Data Q&A 功能请求帮助，创建表格和数据分析等功能在今年晚些时候推出。

- Google Photos：Ask Photos可以帮助用自然语言搜索图片和视频，可以理解并回答复杂问题。

- Circle to Search：现在成为了极佳的学习小帮手，可以在手机或平板上圈选复杂的物理问题，获得分步骤的指导帮助你学会解题。

13 17

歸藏

11:20

简短总结一下昨晚 Google 的 I/O 发布会，重点侧重模型层面的内容。

全线开花，几乎覆盖了目前所有的生成模型类型：

- Gmini 1.5 Pro 宣布开始支持 200 万上下文，跨关键用例的一系列质量改进，例如翻译、编码、推理等”，但没有发布测试结果。

- Gemini Flash：这款更小的 Gemini 模型针对较窄或高频任务进行了优化，其中模型响应时间的速度最为重要。提到百万 Token 的价格比 GPT-3.5 要便宜。

- Gemini 模型家族的构成：

1. Ultra：“最大的模型”（仅在Gemini Advanced提供）
2. Pro：“最佳总体性能模型”（在 API 预览版中提供）
3. Flash：“轻量级速度/效率模型”（在 API 预览版中提供）
4. Nano：“设备上模型”（将内置于Chrome 126中）

- Gemini Gems 谷歌的 GPTs，支持自定义与 Gemini 的互动方式。

- Gemini Live ：“使用声音进行深入的双向对话的能力。”，Project Astra 实时视频理解个人助理聊天机器人，就是基于这个能力。

- Gemma 2：6 月发布规模为27B（之前为 7B 和 2B），以一半的尺寸提供接近 Llama-3-70B 的性能。

- PaliGemma：谷歌的第一个视觉语言开放模型，灵感来自PaLI-3 。

- Veo：DeepMind 对标 Sora 的模型，HN 上有些体验过的人表示不太行，国际象棋的棋盘和棋子生成的都不对。

- Imagen 3：图像模型，能够理解人们自然书写的提示，生成更高质量的逼真图像，并且在渲染文本方面表现卓越。

- Music AI Sandbox：旨在彻底改变音乐创作方式的AI工具套件。用户能够全新创作乐器部分，轻松在不同曲目间转换风格。

- Trillium：最新的TPUs，在每颗芯片的计算性能上，相比上一代TPU v5e，实现了高达4.7倍的显著提升。

23 310

歸藏

09:32

Ilya这几个月首次发声，宣布离开 Open AI。并表示会在适当的时候分享在接下来的项目信息。

14 20

歸藏

01:59

新的谷歌搜索演示，真狠啊，在核心产品上做这么大的改动。

几乎完全用AI重构了谷歌搜索的产品形态。搜索-总结-生成。

01:40

72 224

歸藏

01:47

今晚Google的另一个大招，匹敌Sora的视频生成模型 Veo。#ai#

它可以创建超过60秒的高质量1080p视频片段，可以创建任何风格的视频。

所有的演示都在这个视频里面。

01:41

38 19

歸藏

01:40

谷歌的第一个大招来了Project Astra。

致力于构建一个在日常生活中真正有用的未来AI助手。演示是一次拍摄，实时捕捉的。

02:08

48 325

歸藏

1天前

尝试了一下，Wegic 这个 AI 网页生成工具也太好了。

通过对话来生成和修改页面门槛确实低了很多。整体网站设计和 IP 都太好了。 IP 尤其可爱。

而且生成的网站从内容和美观度上都很好，内容也很丰富。如果补齐一下能力的话可能是 Framer 一个很强力的对手。

这里尝试：wegic.ai

00:38

29 522