Anjhon | 但知行好事，莫要问前程

2025-01-14

Cursor 已经火了一段时间了，在刚发布的时候进行了试用，但说实话给我的冲击感并不强烈，甚至觉得这不就是一节简单的 AI 写代码工具吗，同样的功能其他 vscode 插件也能实现；当时还一直在使用通义灵码，甚至后来还尝试过将 Deepseek 接入到 vscode，同样用着还不赖。直到前段时间又看到铺天盖地的营销，决定再去试用一番，顺便上网看看教程，进行更全面的了解；

实践技巧

LLM

Cursor

Python 中的日志模块 logging

2025-01-05

Python 中的日志模块 logging 使用技巧与应用

OpenAI 于 12 月 5 日开启为期 12 天的系列发布活动，每天发布一个产品或样品，涵盖多个令人期待的 AI 工具和功能升级。包括 o1 满血版上线及 ChatGPT Pro 订阅服务、强化微调技术、Sora 正式版及新版本、ChatGPT Canvas 全面开放、与苹果合作将 ChatGPT 集成到 Apple Intelligence、高级语音模型增强、推出 ChatGPT Projects 功能、ChatGPT Search 全面升级免费开放、o1 推理模型开放 API、通过电话和 WhatsApp 使用 ChatGPT、ChatGPT 与 Mac 应用深度集成以及发布最新一代推理模型 o3 和 o3--mini。

大语言模型

OpenAI

大模型问答——pandas 读取大文件爆内存问题

2024-11-26

在数据大小（32G）和服务器内存大小（360G）差 10 被的情况下，使用 pandas 来读取数据，但是在读取数据的时候会导致内存被占满最终导致 python 脚本被 kill。原因定位。

crontab 是 Linux 和 Unix 系统中的一个用来设置周期性任务调度的工具，它的全称是 "cron table"。crontab 文件包含了 cron 进程需要执行的任务列表，并指定任务的执行时间。cron 进程会根据 crontab 文件中的配置，在指定的时间自动执行任务。

简介不了

SparkSQL 是 Spark 的一个模块，专为处理结构化数据而设计，提供了对 SQL 查询的支持，使得用户可以通过 SQL 或 DataFrame API 进行高效的数据处理和分析。SparkSQL 允许无缝地在结构化数据（如 JSON、Parquet、Hive 表）和 RDD 之间进行转换，集成了 Catalyst 优化器和 Tungsten 执行引擎，从而实现查询优化和高效执行。此外，SparkSQL 还支持与多种数据源的集成，使其在大数据处理和分析领域具有广泛的应用。

大数据

Spark

SparkSQL

1 2 3 4 5 6

...

AnJhon

但知行好事，莫要问前程