104工作快找APP

面試通知不漏接

立即安裝APP

「[TapPay] 網站可靠性工程師 SRE (Site Reliability Engineer)」的相似工作

喬睿科技股份有限公司
共500筆
05/31
台北市中山區3年以上大學
We are looking for a Site Reliability Engineer (SRE) to make sure our cloud-based commerce platform is up and running and healthy. As a SRE for iKala Commerce, you will be responsible for everything from our cloud infrastructure and operating systems to developing tools for code deployment and service monitoring. You will also review our code and system design and partner with developers to build our applications. The SRE role is an integral member of our product development team. You will be a part of the team that makes crucial decisions about how to manage and scale complex, high-performance distributed systems. You will also provide your own perspective on our backend systems and constantly develop innovative ways to improve the way we manage the underlying infrastructure. Our ideal candidate should be able to develop applications on his/her own, but more eager to accelerate the whole team by building systems to improve performance and operational efficiency. Ultimately, you should be involved in all stages of software development to define and improve our SLOs, SLAs & SLIs. Our current tech stack include: GCP, Terraform, Kubernetes, Helm, ArgoCD, Gitlab-CI/CD, Grafana LGTM, 【Key Responsibilities】  1. Designing & implementing infrastructure for collecting metrics, crunching data and improving service monitoring to detect problems before they're visible to our customers. 2. Building systems to automate our server lifecycle, from configuration management, CI/CD to server bootstrap and decommission. 3. Troubleshooting, performing root cause analysis, and resolving production issues from the application and network layers all the way down to the system level. 4. Participating in solution design and advising other developers when building new features so that they're scalable, maintainable, and performing well. 5. Improving the observability of our applications through monitoring, alerting, logging, tracing and profiling, and building such observability features into a common platform. 6. Practicing sustainable incident response and blameless postmortems. 7. Proactively identifying and reducing issues through design, testing, and implementation of software-based solutions. More Info>>>https://www.ikala.ai
應徵
06/04
艾克森科技有限公司電腦系統整合服務業
台北市信義區3年以上專科
[Requirement] 1. 熟悉CI/CD自動化運維之解決方案(Jenkins, Gitlab CI, Ansible, Terraform ) 2. 熟悉基於雲端服務(Aliyun/AWS/GCP)之雲端解決方案 3. 熟悉任一版本之Linux(Centos, Ubuntu, SUSE...etc)之系統管理、調校管理 4. 熟悉容器相關的平台操作(docker-compose, Kubernetes) 5. 具備基礎 Script 開發維護能力 (ex: Shell Script、Python、Go) [Nice to Have]: 1. 具有大型網站服務之高可用性架構規劃、建置、維護經驗者佳。 2. 具有DevOps CI/CD實際導入經驗者佳。 3. 具備良好的溝通表達能力與正常人的抗壓性。 (工作地點:台北或台中皆可)
應徵
06/02
名豐電子股份有限公司電腦軟體服務業
台北市大安區3年以上專科以上
1. 建置與維護研發單位需要的開發環境 2. 建置與維護日誌、監控、部署等維運工具 3. 建置與維護營業需要的雲端環境 4. 執行系統異常問題追蹤與排除作業 5. 定期檢視並記錄監控數據,持續改善服務架構 *1-2年以上遊戲線上產品維運者佳
應徵
06/02
名豐電子股份有限公司電腦軟體服務業
台北市中正區3年以上大學以上
【工作內容】 1. 設計、部署和優化GCP雲端基礎設施,支援開發團隊依實際環境中使用和測試,並能提高系統的性能與彈性。 2. 熟悉與實戰 Kubernetes 的部署與運行工作,為開發團隊提供穩定而高效的服務。 3. 與資深資料庫管理員工作,協助並管理資料庫系統、熟悉GCP相關資料庫解決方案,提供優化建議與支援(RGC與雲端資料庫)。 4. 熟悉資料監控與資源管理,管理資源與報表管理用以報表系統及資源效能分析。 5. 版本控制、熟悉 Git 的基本操作與工作流程,具備 CI/CD 流程實作經驗,熟悉工具如 Jenkins、Git、監控工具程式撰寫。 6. 其他資源監控與分析工具熟悉:Grafana、Prometheus、Elastic Search。 7. 有效追蹤與解決問題,具備Sapi設置資源文件性質。
應徵
06/03
互動資通股份有限公司電腦軟體服務業
新北市新莊區5年以上大學
※目前上班地及面試地點:新北市新店區北新路三段207-3號11樓 本職位為負責簡訊平台的維運工程主管,您將帶領團隊同仁持續確保平台穩定及運行順利,並從基礎設施、應用程式、到商務數據等等多個面向,推動各項維運優化專案進行,以提供上萬個企業客戶高可用、安全、且具高效能的平台使用體驗。主要的工作項目如下.. 1.SRE 架構實踐: -設計與維運監控系統(Prometheus+Grafana+loki),確保服務可觀察性 -建置自動化復原、自動部署、災難備援、備份與容量規劃機制 -持續優化系統可靠性、可用性與效能 2.日常營運與事件處理: -進行異常排查、問題分析與 RCA(Root Cause Analysis)報告撰寫 -配合執行變更管理、故障管理、需求單處理等 ITSM 作業 -支援產品發佈、基礎設施維運(雲端、虛擬機、資料庫、網路)
應徵
06/04
中信安科技有限公司數位內容產業
台北市松山區3年以上專科以上
1、伺服器安裝、設定 2、伺服器日常運維及 Linux 系統安裝 3、網路安全監控及運維 4、系統安裝、設定、測試、備份 5、系統基礎效能調校及資安防護規劃和管理 6、負責突發事件快速回應、處理
應徵
06/02
17LIVE_藝啟股份有限公司網際網路相關業
台北市中山區2年以上大學以上
17 LIVE 歡迎對以下工作內容有興趣的 網站可靠性工程師 加入我們的大家庭! 您將負責: - 負責 17LIVE 基礎架構和產品的整體性能和可靠性。 - 自動化:SRE 看不下去沒有自動化和工具的事情。 - 系統架構:知道系統運作生命週期(ex: 啟動到可以對外提供服務到停止)。 - 部署和變更管理: 知道服務發布流程(例如: GitFlow、GitHubFlow、GitLabFlow)以及如何進行版本控制,理解 GitOps。 - 監控服務:了解如何收集log、metrics以及建立dashboard監控服務。 - 提高可用性:知道如何部署HA架構以及DR架構。 - 系統意外事件處理(改善 On-Call 的體驗,工具和程序),能夠初步判斷意外事件可能因素,協助進行事後分析。 - 了解 IaC 並至少會使用一種 IaC Tool,例如 Terraform。 如果您具備以下工作技能及工作經驗,請不要猶豫立即手刀提出申請: - 了解 Linux 基本運作原理 和樂意更深入了解 Linux 內部結構。 - 良好的程式語言技能,至少在下列之一:Go、C、C ++、Python、Java 和學習其他語言的能力。 - 基礎的 Shell Script 技能。 - 具有 Kubernetes、 CI/CD 、Monitoring 維運經驗。 - 具有 IDC、AWS、GCP 或 Azure 的經驗。 加分條件: - 具備 Kubernetes 或是 cloud 相關證照 - 具備 container 相關知識,例如 docker、containerd、podman。 - 具備其中一種的知識:MySQL、MongoDB、ELK、Datadog、Prometheus 或類似技術。 - 了解 Caching 和 Queue Redis,memcache,RabbitMQ,Apache Kafka…)。 - 對開源軟體有貢獻。 We are currently hiring for Site Reliability Engineer professionals that will take part in: Responsible for the overall performance and reliability of 17LIVE’s infrastructure and products. SREs design and implement the tools that automate building reliable and performant systems. - Ensuring the overall performance and reliability of 17LIVE's infrastructure and products. - Automation: SREs can’t stand tasks that aren’t automated or tools that aren't in place. - System Architecture: Understanding the lifecycle of a system (e.g., from startup to service provision to shutdown). - Deployment and Change Management: Knowing the service release process (e.g., GitFlow, GitHubFlow, GitLabFlow) and how to manage version control, understanding GitOps. - Monitoring Services: Understanding how to collect logs, metrics, and create dashboards for monitoring services. - Enhancing Availability: Knowing how to deploy High Availability (HA) and Disaster Recovery (DR) architectures. - Incident Management: Handling system incidents (improving the On-Call experience with tools and procedures), being able to preliminarily identify possible causes of incidents, and assisting with post-incident analysis. - Understanding Infrastructure as Code (IaC) and being proficient with at least one IaC tool, such as Terraform. Good to Have: - Understanding the basic principles of Linux and a willingness to delve deeper into Linux's internal structure. - Strong programming skills in at least one of the following languages: Go, C, C++, Python, Java, and the ability to learn other languages. - Basic shell scripting skills. - Experience in maintaining Kubernetes, CI/CD, and Monitoring systems. - Experience with IDC, AWS, GCP, or Azure. You will be highly considered if you have the following experience: - Possessing Kubernetes or cloud-related certifications. - Knowledge of container technologies such as Docker, containerd, or podman. - Knowledge of one of the following: MySQL, MongoDB, ELK, Datadog, Prometheus, or similar technologies. - Understanding of caching and queue systems like Redis, Memcached, RabbitMQ, Apache Kafka, etc. - Contributions to open-source software.
應徵
06/06
台北市中山區經歷不拘大學以上
易可思(ecosTek)創立於2020年,為跨國AI軟體集團的成員,集團擁有10年以上提供AIaaS (AI as a service)服務。 團隊組成來自世界級研究型大學,包括 CMU 、University of Michigan、University of Southern California、Columbia University、台灣大學等。 官網:https://www.ecostek.com/ EcosTek, established in 2020, is a distinguished member of a multinational AI software conglomerate with over a decade of experience in delivering AI as a Service (AIaaS). Our team consists of experts hailing from renowned research universities such as CMU, University of Michigan, University of Southern California, Columbia University, and National Taiwan University. Visit our official website at https://www.ecostek.com/ 【工作內容】 1.系統管理:負責伺服器和雲端基礎設施的配置、監控和維護, 確保系統的穩定性和可用性。 2.持續集成與持續交付(CI/CD):設計和實施CI/CD管道, 以自動化應用程式的構建、測試和部署流程。 3.版本控制:使用Git等版本控制工具管理代碼版本,協助團隊進行協作。 4.監控與性能優化:使用監控工具(如Prometheus、Grafana、 CloudWatch等)追蹤系統性能,分析和解決潛在的問題。 5.安全性管理:確保系統和應用程式的安全性,實施最佳安全實踐。 6.跨部門協作:與開發團隊、測試團隊及業務部門緊密合作,促進溝通與協作。 7.公司內部的軟體管理:如zoho、jira、gerrit、ldap等工具。 8.規劃網路管理機制,設定、檢修網路設備。 9. 監控系統運作,並建立危機處理的標準流程。 10. 電腦及週邊設備安裝、設定及問題排除。 11. 監視器、門禁系統維護。 12. 機房伺服器、NAS、電腦、Router等資產管理。 13. 熟練Linux系統操作,能夠進行伺服器的佈署、管理和維護,並依需求架設軟體。 14. 熟練掌握資安技術,具備防火牆、IPS、權限管理、Email 防護系統等相關經驗 【具備條件】 1.擅長工具: 熟悉Linux/Unix系統管理、具備腳本編程能力(如Python、 Bash等)、熟悉容器技術(如Docker、Kubernetes等)、熟悉公有雲 (如 AWS、GCP等)。
應徵
06/06
台北市松山區4年以上大學以上
【工作內容】 ▶︎ 使用基礎設施即代碼(IaC)工具(如 Ansible、Kubernetes)和 CI/CD 流程工具開發應用程式部署管道 ▶︎ 通過自動化等機制實現系統的可持續擴展,並推動改善系統可靠性和效率的變革 ▶︎ 維護和優化容器化平台(Kubernetes),確保服務的穩定性和效能 ▶︎ 熟悉資料庫, 如 MySQL ▶︎ 具備問題解決和故障排除能力,能夠快速識別並解決複雜問題 ▶︎ 對持續改善可觀測性實務和推動創新充滿熱忱 【必備條件】 ▶︎ 理解大量分佈式系統,包括多層系統結構,應用程式安全性,Monitoring 和 Storage ▶︎ 具備 kubernetes、 CI/CD 維運經驗 ▶︎ 具有 AWS 或 GCP 的經驗 (EKS 加分) ▶︎ MySQL
應徵
06/05
雲策數據有限公司電腦軟體服務業
台北市內湖區經歷不拘學歷不拘
【職位責任】 1. 系統架構與自動化: ■ 負責設計、建立和維護可靠的系統架構,包括自動化基礎設施、部署流程和系統監控。 ■ 利用現代化工具,如 Terraform和 Ansible,進行基礎設施即代碼(Infrastructure as Code, IaC)的實施。 2. CI/CD優化: ■ 持續優化 CI/CD 流程,使用 GitLab CI 和其他自動化工具,確保快速、安全的代碼部署。 3. 效能監控與告警: ■ 建立和維護全面的監控系統,使用自動化警報來及時響應系統異常。 ■ 整合 CDN 和高防配置以提升網站的可靠性和性能。 4. 安全性與網絡架構: ■ 維護網絡安全,包括管理防火牆、負載均衡器和安全策略。 ■ 設計並實施網站伺服器架構,確保高可用性和安全性。 5. 日誌管理與可觀察性: ■ 設計與維護集中式日誌系統,使用 Fluent Bit 將應用日誌匯入 Elasticsearch,並整合 Kibana 進行視覺化查詢與分析。 ■ 優化日誌索引與儲存策略,提升查詢效能與故障排查效率。 【技術要求】 1. 雲端與容器技術: ■ 精通 AWS 服務,並具備深入的Docker和Kubernetes操作經驗,包括容器的部署、管理和優化。 2. 編程與腳本: ■ 至少精通一種腳本語言,如 Python或 Shell script,以支持自動化和系統維護。 3. CDN與高流量經驗: ■ 具備 CDN 管理與配置經驗,以及處理高流量服務的能力,能有效增強網站的分發效率和防禦能力。 4. 自動化工具: ■ 熟悉使用 Terraform 和 Ansible 進行自動化管理,以及 Nginx 的配置和維護。 5. 多雲平台經驗: ■ 在阿里雲、騰訊雲、Azure 和 GCP 等多個雲平台上設計和實施網絡架構的實際經驗。 6. 安全架構設計: ■ 在AWS、阿里雲、騰訊雲、Azure 和 GCP 環境中,實施和管理Web應用防火牆(WAF)和 DDoS 防護策略,保護應用免受攻擊,並確保業務連續性。 7. 危機處理能力: ■ 擁有在高壓情況下迅速應對和緩解大規模DDoS攻擊的經驗,能有效保障關鍵基礎設施的安全和運行。
應徵
06/02
台北市信義區2年以上大學以上
主要負責雲端與地端的機台設定與服務監控,需主要熟悉Azure / GCP / AWS的服務,主要的雲端在Azure **專業技能要求:** * **精通 Microsoft Azure 雲端服務:** * 熟悉 Azure Portal、PowerShell、Azure CLI 等管理工具。 * 深入了解 Azure 虛擬網路 (Virtual Network)、網路安全群組 (NSG)、Azure DNS、負載平衡器 (Load Balancer)、應用程式閘道 (Application Gateway) 等網路服務。 * 熟悉 Azure 虛擬機器 (Virtual Machines) 的部署、配置與管理。 * 熟悉 Azure 儲存服務 (Storage Account、Blob Storage、File Storage、Queue Storage、Table Storage) 的規劃與管理。 * 熟悉 Azure 備份與還原 (Azure Backup、Azure Site Recovery) 策略的實施與管理。 * **具備 Azure Pass 服務的使用與管理經驗。** * **熟悉 Site-to-Site VPN 相關技術:** * **具備 Site-to-Site VPN (IPSec、IKEv2 等) 的規劃、設計、部署與故障排除經驗。** * 了解 VPN Gateway 的配置與管理。 * 熟悉混合雲環境的網路整合方案。 * 熟悉網路基礎知識: * TCP/IP 協定、DNS、DHCP、路由、防火牆等網路原理與應用。 * 熟悉作業系統: * 熟悉 Windows Server 或 Linux (至少一種) 作業系統的管理與基本故障排除。 * 腳本與自動化 (加分項): * 具備 PowerShell 或 Bash 等腳本語言的編寫能力。 * 熟悉 Azure Resource Manager (ARM) 範本或 Terraform 等基礎架構即程式碼 (IaC) 工具者尤佳。 * 監控與日誌分析 (加分項): * 熟悉 Azure Monitor 或其他監控工具的使用。 * 具備日誌分析與問題診斷能力。 * 安全性 (加分項): * 了解雲端安全最佳實踐與相關規範。 * 具備 Azure Security Center 或其他安全工具的使用經驗。
應徵
06/03
台北市信義區3年以上大學
Hi,勇者!在 Garena,我們崇尚開放的工作環境,鼓勵創新思維,提倡團隊而非孤單前行,討論最新的技術趨勢,並深信知識分享是成功的秘訣。現在就和我們一起勇闖遊戲前線,引領遊戲行業的潮流與未來吧! #系統工程師 #維運工程師 #運維工程師 #Linux #Kubernetes #Grafana監控 #公有雲 ◎ 你將負責 ...... - 導入及運維 Garena 的代理及自研遊戲,包含遊戲開發到上線的每個階段,參與遊戲架構設計評估,提供自動化維運、工具及資料庫設計等支援。 - 負責遊戲版本及內容更新、自動化維運導入。 - 在遊戲服務出現故障時,第一時間響應,對已知故障能按流程進行通報並按預案執行,未知故障組織相關人員聯合排除障礙。 - 對各遊戲的服務器資產進行管理,梳理服務器資源狀況,數據中心分佈情況,網絡專線及帶寬情況,能夠合理使用服務器資源,根據不同服務的需求,分配不同配置的服務器,確保服務器資源的充分利用。 - 其餘例行性檢查及預案、緊急任務支援等。 - 工作環境:Linux,並以公有雲為主,地端為輔。 ◎ 我們希望你具備 ...... - 3 年以上 Linux 操作經驗:熟練掌握 Linux 系統的日常操作與維護,能夠處理常見的系統管理、建置、運維任務。 - Kubernetes 熟練操作:熟悉 Kubernetes 的基本概念和操作,能夠進行集群的搭建、運維及故障排除。具備容器化(docker)應用部署、管理及優化經驗,理解微服務架構及其在 K8s 中的運行模式。 - 監控工具經驗:熟悉 Zabbix 和 Grafana 等監控工具的配置與使用,能夠設置服務監控、警報及視覺化儀表板,並解決監控過程中的常見問題。 - Shell 腳本編寫:能夠熟練撰寫 Shell Script / Python等,以實現自動化操作、任務調度和日常運維管理工作,提升系統運維效率。 - 集群搭建與管理經驗:有大規模集群搭建、維護和運營的經驗,能夠處理多節點部署、負載均衡等問題,並保證集群的穩定性和擴展性。 - 故障排除經驗:具備故障排查能力,能夠快速定位和解決系統和應用層的問題,確保服務的穩定性和高可用性。 - 扎實的網路與系統知識。 - 清楚的邏輯思考能力與責任感。 - 良好的團隊合作和溝通能力。 - 中等的英文溝通能力:用於信件及訊息回覆。 ◎ 你知道嗎?Garena 的系統工程師與其他公司的機會差異在於,你將從這份職務獲得…… \ 探索多元產品架構 / 每款遊戲有獨立的架構,在 Garena 工作一年能抵外面三年,快進來累積豐富的運維經驗,快速提升產品架構設計與維護的專業技能吧! \ 大規模分布式系統 / 工作將涉及跨機房架構的設計與維護,您將接觸到多種高效、可橫向擴展的解決方案,挑戰您在大規模分布式系統的運維能力! \ 自動化 & 持續集成和部署 / 透過大規模部署及自動化更新的場景,您將學習如何運用自動化工具提升部署效率,並實現持續集成與部署的高效運維流程! \ 高可用性與災難恢復的挑戰 / 您將參與規劃高可用性系統,並設計災難恢復方案,確保在任何情況下都能避免單點故障,保障遊戲服務的穩定運行!
應徵
06/05
眾鼎科技有限公司人力派遣服務
台北市中山區3年以上專科以上
1. 系統維護與監控:負責設計、構建和維護高可靠性的生產系統。持續監控系統性能,並確保系統達到既定的服務水平目標(Service Level Objectives, SLOs)。 2. 故障分析與解決:快速響應系統中斷和性能問題,進行根本原因分析(Root Cause Analysis, RCA),並實施長期解決方案以防止問題再次發生。 3. 自動化與工具開發:開發和部署自動化工具來提高系統效率和減少人為錯誤。這包括自動化部署、故障恢復和其他常規維護任務。 4. 跨部門協作:與開發、運營和產品管理團隊緊密合作,以確保技術解決方案滿足功能和性能要求。積極參與產品的設計和改進過程,提供可靠性和可維護性的反饋。 5. 性能優化:分析現有系統的性能,識別瓶頸並實施優化策略,以提高效率和降低成本。 6. 持續學習與技術更新:保持對業界發展的敏感性,學習和實施新技術以不斷提升系統的可靠性和性能。 7. 文件編制與維護:編制詳細的系統架構、配置文檔和操作手冊,以支持團隊成員的瞭解和操作。 --- 1. System Maintenance and Monitoring: Responsible for designing, building, and maintaining highly reliable production systems. Continuously monitor system performance to ensure compliance with established Service Level Objectives (SLOs). 2. Incident Analysis and Resolution: Respond quickly to system outages and performance issues, conduct Root Cause Analysis (RCA), and implement long-term solutions to prevent recurrence of problems. 3. Automation and Tool Development: Develop and deploy automation tools to improve system efficiency and reduce human errors. This includes automating deployment, failure recovery, and other routine maintenance tasks. 4. Cross-Departmental Collaboration: Work closely with development, operations, and product management teams to ensure technical solutions meet functional and performance requirements. Actively participate in the design and improvement process of products, providing feedback on reliability and maintainability. 5. Performance Optimization: Analyze the performance of existing systems, identify bottlenecks, and implement optimization strategies to enhance efficiency and reduce costs. 6. Continuous Learning and Technology Upkeep: Stay current with industry developments, learn and implement new technologies to continuously improve system reliability and performance. 7. Documentation and Maintenance: Prepare detailed system architecture, configuration documents, and operational manuals to support the understanding and operations of team members.
應徵
06/08
蓬雲科技有限公司電腦系統整合服務業
台北市內湖區3年以上專科以上
【工作內容】 * 建置與維運基礎設施。 * 設計和調整監控數據,持續優化及調校系統性能。 * 日常運維自動化腳本開發、維護、備份及復原。 * 配合應用程式需求維運及持續優化自動化流程(環境搭建、參數配置、業務調試、單元測試及系統監控)。 * 編寫技術文檔,優化工作流程。 【要求條件】 * 熟悉監控系統與日誌系統管理(Prometheus、Grafana、ELK)。 * 對CICD(Jenkins,Ansible,GitLab,Terraform等工具的使用)有實際經驗。 * 熟悉至少一門腳本語言:Shell、Python 等語言實現配置腳本功能,可編寫自動化運維工 具。 * 熟悉容器化技術 (Docker、Docker-Compose)。 * 熟悉雲端服務(AWS, GCP)。 * 有操作CDN經驗。 * 基本資安及網路安全知識。 * 具有較強的實踐能力、良好的溝通、團隊協作精神,具備一定的抗壓能力。 #DevOps #Docker #CICD
應徵
06/04
天瀚國際科技有限公司其它軟體及網路相關業
台北市松山區3年以上學歷不拘
你是否渴望在技術上能持續進步或找尋志同道合的夥伴一起交流?或是希望能有機會一起改善團隊的工作流程?那 UniverseTech 絕對是值得您考慮的第一首選! 重視技術、尊重專業是我們的核心精神,我們致力於開發全球線上娛樂遊戲服務。團隊以 Scrum 精神進行短週期交付,不斷迭代進步,打造符合市場需求的高品質產品。 ✦✦ 尊重專業、技術成長 ✦✦ 我們重視團隊成長,也重視個人成長。樂於使用新的技術來解決問題,也樂於接受各種挑戰與技術討論,除了平時的架構規劃和 Code Review 之外,團隊也充滿了許多平時熱情參與社群與研究技術的夥伴。除了透過不定期的技術分享或讀書會來讓彼此交流、一起學習進步外,若有想討論的其他技術/架構設計等問題也可以隨時發起討論。 ✦✦ 平等溝通、快樂工作 ✦✦ 我們採用階層扁平化的組織管理,每個團隊成員的聲音對我們來說都很重要,只要是對團隊/工作流程有幫助的意見,我們都鼓勵成員提出來讓大家共同認真討論。公司希望成員都能真心喜歡上這份工作,維持好的辦公氣氛是我們最大目標。 ✦✦ 積極認真、重視品質 ✦✦ 天瀚每位成員的自主性強,對新的技術抱有極高的熱忱,在這裡你可以找到很多專業且實力堅強、能互相交流並學習的同事。公司給予大家高度的工作彈性,成員則回饋出高效率的產出,並精準達成季度、年度目標。 透過 standup meet、retrospective 定期檢視產品弱點,並部署完整 CICD 流程、測試至整合上線,確保產品穩定與品質。 如果您也嚮往積極、認真、樂於溝通與交流技術的團隊,非常歡迎您加入我們! 想了解更多辦公室的大小事,歡迎追蹤我們的粉絲團: https://www.facebook.com/universetech.taipei/ ﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊﹊ 【職務內容】 1. 與開發團隊共同規劃系統架構、建置部署流程,以及分析與改善系統效能。 2. 建置自動化的監控與告警系統,發生問題可以迅速定位問題。 3. 迅速處理並排除正式環境的問題,並進行根因分析,以提升未來系統穩定性。 4. 協助測試與強化高可用性(HA)架構及異地備援機制。 5. 持續改善服務架構設計與技術方案,以支援業務的成長需求。 【技能需求】 1. 熟悉 Linux 系統操作 2. 熟悉 Kubernetes 架構、知識與管理經驗 3. 熟悉 CI/CD 工具(如:Ansible, Terraform, GitLab CI 等) 4. 熟悉主流關聯與非關聯式的資料庫(如:MySQL, Mongo 等) 5. 熟悉主流 Cloud Service 操作(如:AWS, Google Cloud 等) 6. 理解網路原理與相關知識(如:TCP/UDP Protocol, OSI Model, Load Balancing 等) 7. 熟悉 Nginx 的管理與設定 8. 有良好的 Shell Script 技能 9. 有 Monitoring 與 Log 經驗 【加分條件】 1. 熟悉中國線路狀況 2. 有 Clickhouse 管理經驗 3. 熟悉 GCP 操作 4. 有 ArgoCD、Helm 操作管理相關經驗 5. 有 Vault 使用經驗 【人格特質】 1. 善於團隊合作溝通、有耐心、抗壓性強、配合度高 2. 樂於學習與追求自我成長的精神
應徵
05/06
宏燁資訊股份有限公司電腦系統整合服務業
台北市中正區3年以上專科
1.Kubernetes平台建置(OCP, Tanzu…etc) 2.Kubernetes平台監控及日誌服務建置 3.Kubernetes平台日常維運、問題排除 4.自動化 Kubernetes 應用部署 (CI/CD) 5.撰寫技術、安裝、操作與問題排除文件 6.Middleware(JBOSS,WAS) 安裝、維護 7.主管交辦事項
應徵
06/03
台北市中山區3年以上大學
【工作內容】 1. 協同處理維運客戶端的需求任務 2. 優化維運客戶的雲端架構 3. 維運需求的自動化開發 4. 優化監控/告警/通報/處理流程 5. 編寫維運報告(包含事故/異常報告)、技術/操作文件 【必備條件/技能】 1. 熟悉至少一個公有雲(AWS/GCP/AZURE)操作,有證照者佳 2. 熟悉VM及Container 3. 有Kubertenes(EKS/GKE/AKS)相關的建置、維護作業(含CI/CD pipeline) 4. 使用過任一種監控工具並了解Log System 5. IaC 或 Configuration Management Tool 使用經驗 6. 熟悉至少一種程式語言 (python, golang, nodejs等)
應徵
06/02
喬睿科技股份有限公司網際網路相關業
台北市中正區5年以上專科以上
TapPay 是一個商店的平台,我們致力於成為商店的最佳夥伴,圍繞著商店進化。TapPay 由多個不同的服務所構建,包含獨家無跳轉支付、多元支付整合、信用卡風險、3DS 2.0、信用卡代碼 (TSP) 及商店行銷工具等。 我們提倡敏捷文化,由多個 Scrum Team 協作替平台打造更優質的服務; 我們擁抱創新,你可以將想法在黑板上勾勒出輪廓、透過程式碼變成現實; 我們傾聽不同的聲音,密切的溝通使我們的想法堅不可摧。 我們開發交易相關的服務,每分每秒有來自各地的交易、流量管理及風險管控,需要面對高頻率、承載、容錯等各方面的需求與挑戰。歡迎勇於挑戰、充滿熱誠的你加入我們! - 以敏捷式開發參與產品開發流程,包含需求、設計、開發與測試面向的規劃與執行 - 釐清專案管理師的需求,與團隊合作設計後端系統的應用流程 - 制定並開發 Restful API - 架設 CI/CD 系統 - 線上異常排除 ⭐️歡迎各種背景的優秀人才加入我們的團隊! 我們致力於營造一個多元與包容的工作環境,並誠摯邀請所有具備相應條件的候選人提交履歷。無論您是否為身障人士,我們都鼓勵您來應徵發揮所長及潛能。 如果您有任何需要協助的地方,請隨時聯繫HR,我們將確保您在應聘過程中具有平等的機會。
應徵
05/28
台北市信義區2年以上大學以上
1. 深入研究開發流程,學習和理解每個應用程式元件的機制,並提高產品的可擴展性,穩定性和性能 2. 執行常規和臨時服務器端部署,性能微調和故障排除 3. 設計和開發自動化技術操作平台 4. 系統資源管理 5. 與研發團隊合作全產品線的壓力測試,以增強性能並消除應用程序的冗餘。 6. 準備例行操作文件 7. 維持團隊的 CI / CD 服務,以提高開發效率 8. 構建工具以進行自動化操作
應徵
05/28
OpenNet_開網有限公司網際網路相關業
台北市中正區3年以上高中以上
If You ● Are a self-driven DevOps Engineer with proven experience in large-scale micro-service systems hosted on AWS. ● Have a deep understanding of cloud architecture, AWS technologies and cloud security best practices. ● Are following the latest industry trends and are passionate about cloud computing for large-scale systems. Key Responsibilities ● Work in a team of DevOps and DBA professionals – initially 3 people, although this will expand throughout the country expansion ● Improve existing infrastructure and CI/CD procedure ● Holistically improve all aspects of our infrastructure, including reducing costs, improving build and deployment times, streamlining environment provisioning, lowering load times, incorporating the latest techniques and technologies, and more ● Monitor and maintain the existing cloud infrastructure via autoscaling, automated alerts ● Take ownership and responsibility for our cloud operation activities ● Liaise with external security agencies for annual audits as well as perform our own internal security sweeps ● Aid in reconfiguring existing architecture to allow for rapid deployments to new countries ● Report to DevOps Leader/Director Our Stack ● Backend Application Framework: Spring Boot (Java Config + Embedded Tomcat) ● Frontend Application Framework: VueJS ● Micro Service Framework: Spring Cloud Dalston (Netflix Eureka + Netflix Eureka + Netflix Ribbon + Feign) ● Database: AWS RDS, RDS Proxy, MONGODB ● Public Cache: AWS ElastiCache + Redis ● Message Queue: Apache RocketMQ, RabbitMQ ● Distributed Scheduling: Dangdang Elastic Job ● Data Index and Search: ElasticSearch ● Log Real-time Visualization: ElasticSearch + Logstash + Kibana, Grafana Loki ● Business Monitoring: Prometheus + Grafana ● Reverse Proxy: Nginx ● CDN: Cloudflare ● Server Virtualization Container: AWS EKS + AWS EC2 ● Server Operation System: CentOS ● Static File Storage: AWS S3 ● Inner DNS Resolution: AWS Route 53 ● Network Management: AWS VPC ● Cluster Management and Scaling: AWS OpsWorks ● Cluster Monitoring: Prometheus + AWS CloudWatch ● HTTPS Certificate Management: AWS Certificate Manager ● Malicious Attack Defending: AWS WAF & Shield ● Cluster Alert: AWS SNS + Slack ● Continuous Integration/Deployment: Jenkins, Rancher, ArgoCD ● Configuration Tool: Ansible, Chef, Salt
應徵
OSZAR »