即刻App年轻人的同好社区
下载
App内打开
歸藏
519关注12k被关注24夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
置顶
歸藏
12月前
很多朋友最近老问我一些我之前写过的东西在哪里,所以整理了一下写个置顶贴,内容会定期更新:

1️⃣ 我运营的 AIGC 周刊每周一更新,主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章:
op7418.zhubai.love

2⃣️ 我的Midjourney作品汇总和对应的提示词:
walling.app

3⃣️ 我开发的一些产品

帮你将 Midjourney 的图片和提示词快速收集到你的 Notion 数据库中:
mp.weixin.qq.com

帮你自动分段翻译 Midjoureny 官网的提示词:
mp.weixin.qq.com

利用 ChatGPT 自动监控对应领域的信息并处理和发送到Discord 频道:
op7418.zhubai.loveposts/2251721691841511424

4⃣️ 我写的一些教程

AI 歌手系列课程教你使用和训练自己的 AI 歌手模型:
mp.weixin.qq.com
mp.weixin.qq.com

Stable Diffusion 保姆级入门教程包括 Web UI 的部署和 LoRA 模型的使用:
op7418.zhubai.loveposts/2238998671356555264
op7418.zhubai.loveposts/2239983151969951744

Stable Diffusion 模型大神工作流解析:
mp.weixin.qq.com
web.okjike.com

教你十几分钟不用代码创建自己的AI应用
mp.weixin.qq.com
13105
歸藏
15:48
🧪 #晚安提示词 昨天玩了一下 Niji 的随机风格探索,找到个不错的风格。

代码:--sref 1180446317

效果:会使 Niji 生成的图片变成涂鸦风格,背景和人物主体都会变,而且风格很稳定直接丢到提示词后面就行。
11
歸藏
13:52
还有就是发布会那个 PPT,整个屏幕巨长,摄像头根本无法拍完完整的 PPT,只能用摇臂拍,远距离摇臂拍的 PPT 根本无法看清楚内容。

起码跟手机厂商学一下怎么布置会场和转播。给人的感觉就是爱看不看,非常傲慢。

歸藏: 字节这个AI发布会开的,到现在想要获取信息只能去看回放,自己的公众号连一篇总结文章都没有。 即使媒体想发都没有物料可以发,发布会的模型介绍也很简单,根本看不出跟其他家模型能力的区别。

12
歸藏
13:47
字节这个AI发布会开的,到现在想要获取信息只能去看回放,自己的公众号连一篇总结文章都没有。

即使媒体想发都没有物料可以发,发布会的模型介绍也很简单,根本看不出跟其他家模型能力的区别。
123
歸藏
11:57
Google I/O 大会总结第二部分,主要是产品层面的内容:

- 谷歌搜索的更新:

1. AI Overviews:今天将开始向美国所有人推出,很将能够通过选项调整 AI 概述,以简化语言或更详细地解释。

2. 引入多步骤推理能力,这一功能能够将复杂的问题拆解成多个小部分,明确解决问题的顺序和方法。

3. 很快就能在搜索中使用视频提问了。

4. 提前计划:在搜索中直接具有规划功能,可以为需要的任何事物制定计划,从餐饮到度假。

5. AI 组织的搜索结果:搜索将使用生成式人工智能与您进行头脑风暴,并创建一个由人工智能组织的结果页面(跟 Arc 那个 Demo 类似)。

- Workspace(Gmail): 内置了Gemini Pro 1.5,可以帮助总结查找邮件内容和编写邮件回复。

- 谷歌文档:侧边栏的 Gemini Pro 1.5 集成,文档的改写总结等。

- 谷歌表格:使用 Gemini Data Q&A 功能请求帮助,创建表格和数据分析等功能在今年晚些时候推出。

- Google Photos:Ask Photos可以帮助用自然语言搜索图片和视频,可以理解并回答复杂问题。

- Circle to Search:现在成为了极佳的学习小帮手,可以在手机或平板上圈选复杂的物理问题,获得分步骤的指导帮助你学会解题。
17
歸藏
11:20
简短总结一下昨晚 Google I/O 发布会,重点侧重模型层面的内容。

全线开花,几乎覆盖了目前所有的生成模型类型:

- Gmini 1.5 Pro 宣布开始支持 200 万上下文,跨关键用例的一系列质量改进,例如翻译、编码、推理等”,但没有发布测试结果。

- Gemini Flash:这款更小的 Gemini 模型针对较窄或高频任务进行了优化,其中模型响应时间的速度最为重要。提到百万 Token 的价格比 GPT-3.5 要便宜。

- Gemini 模型家族的构成:

1. Ultra:“最大的模型”(仅在Gemini Advanced提供)
2. Pro:“最佳总体性能模型”(在 API 预览版中提供)
3. Flash:“轻量级速度/效率模型”(在 API 预览版中提供)
4. Nano:“设备上模型”(将内置于Chrome 126中)

- Gemini Gems 谷歌的 GPTs,支持自定义与 Gemini 的互动方式。

- Gemini Live :“使用声音进行深入的双向对话的能力。”,Project Astra 实时视频理解个人助理聊天机器人,就是基于这个能力。

- Gemma 2:6 月发布规模为27B(之前为 7B 2B),以一半的尺寸提供接近 Llama-3-70B 的性能。

- PaliGemma:谷歌的第一个视觉语言开放模型,灵感来自PaLI-3

- Veo:DeepMind 对标 Sora 的模型,HN 上有些体验过的人表示不太行,国际象棋的棋盘和棋子生成的都不对。

- Imagen 3:图像模型,能够理解人们自然书写的提示,生成更高质量的逼真图像,并且在渲染文本方面表现卓越。

- Music AI Sandbox:旨在彻底改变音乐创作方式的AI工具套件。用户能够全新创作乐器部分,轻松在不同曲目间转换风格。

- Trillium:最新的TPUs,在每颗芯片的计算性能上,相比上一代TPU v5e,实现了高达4.7倍的显著提升。
310
歸藏
09:32
Ilya这几个月首次发声,宣布离开 Open AI。并表示会在适当的时候分享在接下来的项目信息。
20
歸藏
01:59
新的谷歌搜索演示,真狠啊,在核心产品上做这么大的改动。

几乎完全用AI重构了谷歌搜索的产品形态。搜索-总结-生成。
01:40
224
歸藏
01:47
今晚Google的另一个大招,匹敌Sora的视频生成模型 Veo。#ai#

它可以创建超过60秒的高质量1080p视频片段,可以创建任何风格的视频。

所有的演示都在这个视频里面。
01:41
19
歸藏
01:40
谷歌的第一个大招来了Project Astra。

致力于构建一个在日常生活中真正有用的未来AI助手。演示是一次拍摄,实时捕捉的。
02:08
325
歸藏
1天前
尝试了一下,Wegic 这个 AI 网页生成工具也太好了。

通过对话来生成和修改页面门槛确实低了很多。整体网站设计和 IP 都太好了。 IP 尤其可爱。

而且生成的网站从内容和美观度上都很好,内容也很丰富。如果补齐一下能力的话可能是 Framer 一个很强力的对手。

这里尝试:wegic.ai
00:38
522